Como criar uma tabela de dados de duas vias com R

UMA tabela de duas vias

é uma tabela que descreve duas variáveis ​​de dados categóricos juntos, e R dá-lhe um conjunto de ferramentas inteira para trabalhar com tabelas de duas vias. Eles contêm o número de casos para cada combinação das categorias em ambas as variáveis. A análise de dados categóricos começa sempre com mesas. Mas, primeiro, você tem que criar as tabelas.

Como criar uma tabela de dados R partir de duas variáveis

Por exemplo, você quer saber quantos carros têm três, quatro, ou cinco engrenagens, mas se separaram para carros com caixas de velocidades automáticas e carros com caixas de velocidades manuais. Você pode fazer isso novamente com o uso do mesa() funcionar com dois argumentos, como este:

> Com (carros, mesa (am, engrenagem)) 3 4 5auto 0 8 5manual 15 4 0

Os níveis da variável que você dá como primeiro argumento são os nomes de linha, e os níveis da variável que você dá como o segundo argumento são os nomes das colunas. Na tabela, você começa a contagem para cada combinação. Por exemplo, você pode contar com 15 carros com caixas de velocidades manuais e três engrenagens.

Como criar tabelas de dados R partir de uma matriz

Os pesquisadores também usar tabelas para o negócio mais sério, como para descobrir se um determinado comportamento (como fumar) tem um impacto sobre o risco de contrair uma doença (por exemplo, câncer de pulmão). Desta forma, você tem quatro casos possíveis: comportamentos de risco e doentes, comportamentos de risco e saudáveis, nenhum comportamento de risco e saudáveis, ou nenhum comportamento de risco e doentes.

Muitas vezes, o resultado de um estudo de tais consiste nas contagens para cada combinação. Se você tem as contagens para todos os casos, você pode facilmente criar a tabela mesmo, como este:

> julgamento lt; - matriz (c (34,11,9,32), ncol = 2)> COLNAMES (trial) lt; - c ( "doente", "saudável")> rownames (trial) lt; - c ( «risco», «no_risk ')> trial.table lt; - as.table (trial)

Com este código, faça o seguinte:

  1. Criar uma matriz com o número de casos para cada combinação de / no comportamento de risco doente / saudável e de risco.

  2. Adicionar nomes de colunas de salientar que categoria as contagens são para.

  3. Converter essa matriz para uma tabela.

O resultado se parece com isso:

> Trial.tablesick healthyrisk 349no_risk 11 32

Uma tabela como trial.table pode ser visto como um resumo das duas variáveis. Uma variável indica se a pessoa está doente ou saudável, e outra variável indica se a pessoa mostra o comportamento de risco.

Como para extrair os dados de I

Apesar de tabelas e matrizes são dois animais diferentes, você pode tratar uma tabela de duas vias como uma matriz na maioria das situações. Isto torna-se útil se você quer extrair valores da tabela. Se você quer saber quantas pessoas estavam doentes e apresentaram comportamento de risco, basta fazer o seguinte:

> Trial.table [ 'risco', 'doentes'] [1] 34

menu