Como avaliar as diferenças em seus dados com R

Para verificar o modelo de dados que você criou com ANOVA (análise de variância), você pode usar R de resumo()

função no modelo de objeto como este:

> Resumo do valor (AOVModel) Df Sum Sq média Sq F Pr (> F) spray5 2669 533,8 34,7 lt; 2e-16 *** resíduos 66 1015 15,4 --- Signif. códigos: 0 '***' 0.001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

R imprime-lhe a tabela de análise de variância que, em essência, diz-lhe se os termos diferentes podem explicar uma parcela significativa da variância nos dados. Esta tabela diz só algo sobre o termo, mas nada sobre as diferenças entre os diferentes sprays. Para isso, você precisa cavar um pouco mais fundo.

Como verificar as tabelas do modelo de dados

Com o model.tables () função, você pode dar uma olhada nos resultados para os níveis individuais dos fatores. A função permite que você crie duas mesas de diferente ou você olhar para o resultado médio estimado para cada grupo, ou você olhar para a diferença com a média geral.

Para saber a quantidade de efeito a cada pulverização teve, você pode usar o seguinte código:

> model.tables (AOVModel, type = "efeitos") Tabelas de effectsspraysprayA B C D E F5.000 5,833 -7,417 -4,583 -6,000 7.167

Aqui você vê que, por exemplo, spray E resultou, em média, em seis erros menos do que a média de todos os campos. Por outro lado, em áreas onde a pulverização A foi usado, os fazendeiros encontrado, em média, cinco erros mais em comparação com a média geral.

Para obter os meios modelados por grupo ea média geral, basta usar o valor do argumento type = 'significa' ao invés de type = "efeitos".

Como olhar para as diferenças individuais em dados

Um agricultor provavelmente não iria considerar a compra de pulverização A, mas que sobre pulverização D? Embora sprays E e C parecem ser melhores, eles também podem ser muito mais caro. Para testar se as diferenças de pares entre os sprays são significativos, você usar o teste de Tukey Honest diferença significativa (HSD). o TukeyHSD () função permite-lhe fazer isso muito facilmente, como este:

> comparações lt; - TukeyHSD (Modelo)

o comparações objeto agora contém uma lista onde cada elemento é nomeado após um fator no modelo. No exemplo, você tem apenas um elemento, chamado spray. Este elemento contém, para cada combinação de sprays, o seguinte:

  • A diferença entre os meios.

  • O nível inferior e superior do intervalo de confiança de 95 por cento em torno dessa diferença média.

  • O valor de p que informa se essa diferença é significativamente diferente de zero. Este valor de p é ajustado usando o método de Tukey (daí, o nome da coluna p adj).

Você pode extrair todas as informações utilizando os métodos clássicos de extração. Por exemplo, você obter as informações sobre a diferença entre D e C como este:

> Comparações $ pulverizar [ 'D-C',] difflwrupr p adj2.8333333 -1,8660752 7,5327418 0,4920707

Essa diferença não parece impressionante, se você perguntar Tukey.

Como traçar as diferenças

o TukeyHSD objeto tem outro recurso interessante: Ele pode ser plotado. Não se preocupe em procurar uma página de ajuda da função trama - tudo o que você encontrará é uma frase: # 147 Há um método de parcelas. # 148- Mas definitivamente funciona! Experimentá-lo como este:

> Plot (Comparações, las = 1)

Você vê a saída desta linha simples. Cada linha representa a diferença média entre os dois grupos com o intervalo de confiança de acordo. Sempre que o intervalo de confiança não inclui zero (a linha vertical), a diferença entre os dois grupos é significativa.

Você pode usar alguns dos parâmetros gráficos para tornar a trama mais legível. Especificamente, o las parâmetro é útil aqui. Definindo-o como 1, você se certificar de todos os rótulos dos eixos são impressos na horizontal para que você possa realmente lê-los.

image0.png

menu