Como analisar dados em tabelas com R

Você pode usar o R ​​de prop.test ()

função dos dados em tabelas e matrizes. Para prop.test (), estas tabelas necessitam de ter duas colunas com o número de contagens para os dois resultados possíveis.

Como testar contingência de tabelas

Alternativamente, você pode usar o chisq.test () funções para analisar tabelas com uma qui-quadrado (# 967-2) Teste de contingência. Para fazer isso na matriz com os dados do cinto de segurança, basta fazer o seguinte:

> Chisq.test (seatbelt.table)

Isso retorna o seguinte resultado:

 O teste do qui-quadrado de Pearson com Yates correctiondata continuidade: survivorsX-quadrado = 24,3328, df = 1, p = 8.105e-07

Os valores para a estatística (X-quadrado), Os graus de liberdade, e o valor P é exactamente o mesmo como com o prop.test () função. Isso é de se esperar, porque - neste caso, pelo menos, - ambos os testes são equivalentes.

Como testar tabelas com mais de duas colunas

ao contrário do prop.test () função, o chisq.test () função pode lidar com tabelas com mais de duas colunas e ainda com mais do que duas dimensões. Para ilustrar isso, vamos dar uma olhada na tabela HairEyeColor. Você pode ver a sua estrutura com o seguinte código:

> Str Tabela (HairEyeColor) [1: 4, 1: 4, 1: 2] 10 3 32 53 11 50 10 30 10 25 ...- attr (*, "dimnames") = 3 Lista de .. $ cabelo: chr [1: 4] "Black" "Brown" "Red" "Blond" .. $ olhos: chr [1: 4] "Brown" "Blue" "Hazel" "verde" .. $ Sexo: chr [1: 2] "Masculino" "Feminino"

Assim, a mesa HairEyeColor tem três dimensões: uma para a cor do cabelo, um para a cor dos olhos, e um para o sexo. A tabela representa a distribuição destas três características entre 592 estudantes.

Os nomes das dimensões de uma tabela são armazenados em um atributo chamado dimnames. Como você pode ver a partir da saída do str () função, esta é realmente uma lista com os nomes para as linhas / colunas em cada dimensão. Se essa lista é uma lista com o nome, os nomes são usados ​​para marcar as dimensões. Você pode usar o dimnames () função para extrair ou alterar os nomes de dimensão.

Para verificar se a cor do cabelo e cor dos olhos estão relacionados, você pode recolher a mesa durante as duas primeiras dimensões usando o margin.table () funcionar para resumir o cabelo e cor dos olhos para ambos os sexos. Esta função soma os valores em algumas dimensões para dar-lhe um quadro-resumo com menos dimensões. Para isso, você tem que especificar quais as margens que você deseja manter.

Assim, para obter a tabela de cabelo e cor dos olhos, use o seguinte:

> HairEyeMargin lt; - margin.table (HairEyeColor, a margem = c (1,2))> HairEyeMarginEyeHair Castanhos Azuis Mel GreenBlack 68 20 15 5Brown 119 84 54 29Red 26 17 14 14Blond 7 94 10 16

Agora você pode simplesmente verificar se o cabelo e cor dos olhos estão relacionados, testando-a nesta tabela:

> Chisq.test testdata (HairEyeMargin) de Pearson Chi-quadrado: HairEyeMarginX-quadrado = 138,2898, df = 9, p-valor lt; 2.2e-16

Como esperado, o resultado deste teste diz que algumas combinações de cabelo e cor dos olhos são mais comuns do que outros. Não é uma grande surpresa, mas você pode usar essas técnicas em outras questões de pesquisa e mais interessantes.

menu