Como olhar para Margens de dados e proporções em R

Na análise de dados categóricos, muitas técnicas R usar o totais marginais

da tabela nos cálculos. Os totais marginais são as contagens totais de casos sobre as categorias de interesse. Por exemplo, os totais marginais para o comportamento seria a soma sobre as linhas da tabela trial.table.

Como adicionar margens para a mesa

R permite estender uma tabela com os totais marginais das linhas e colunas em um simples comando. Para isso, você usar o addmargins () função, como este:

> addmargins (trial.table) Sumrisk saudável doente 349 43no_risk 11 32 41 86 43Sum45

Você também pode adicionar as margens de apenas uma dimensão, especificando a margem argumento para o addmargins () função. Por exemplo, para obter apenas as contagens marginais para o comportamento, faça o seguinte:

> Addmargins (trial.table, a margem = 2) doente saudável Sumrisk 349 43no_risk 11 32 43

o margem argumento toma um número ou um vetor de números, mas pode ser um pouco confuso. As margens são numerados da mesma forma que na aplicar() função. assim 1 significa linhas e 2 para colunas. Para adicionar a margem de coluna, você precisa definir margem para 2, mas esta margem coluna contém os totais de linha.

Como calcular proporções

Você pode converter uma tabela com contagens para uma mesa com proporções usando muito facilmente o prop.table () função. Isso também funciona para tabelas multiway. Se você quiser saber as proporções de observações em cada célula da tabela para o número total de casos, basta fazer o seguinte:

> Prop.table (trial.table) healthyrisk doente 0,3953488 0,1279070 0,3720930 0.1046512no_risk

Isto diz-lhe que, por exemplo, 10,4 por cento das pessoas no estudo eram saudáveis, mesmo quando eles mostraram comportamentos de risco.

Como calcular proporções mais colunas e linhas

Mas e se você quiser saber qual fração de pessoas com comportamento de risco ficou doente? Então você não tem que calcular as proporções dividindo as contagens pelo número total de casos para todo o dataset- em vez disso, você dividir as contagens dos totais marginais.

R permite fazer isso facilmente usando, novamente, o prop.table () função, mas desta vez o especificando margem argumento.

Dê uma olhada na tabela novamente. Deseja-se calcular as proporções mais de cada linha, porque cada linha representa uma categoria de comportamento. Assim, para obter as proporções corretas, você especificar Margem = 1 como isso:

> Prop.table (trial.table, a margem = 1) healthyrisk doente 0,7906977 0,2558140 0,7441860 0.2093023no_risk

Em cada linha, as proporções resumir a 1. Agora você pode ver que 79 por cento das pessoas que mostram comportamentos de risco ficou doente. Bem, isso não é grande notícia de que o comportamento de risco pode causar doenças, e as proporções que figuram no último ponto de resultado nesse sentido.

No entanto, os cientistas acreditam que você só se você pode guardá-lo de uma forma mais objetiva. Esse é o ponto em que você deve considerar fazer alguns testes estatísticos.

menu