Como comparar duas amostras de dados com R
R dá-lhe dois testes padrão para comparação de dois grupos com dados numéricos: o teste t com o t.test ()
Menu
Como usar a função de Wilcoxon de R para dados anormalmente distribuídos
Em alguns casos, seus dados se desvia significativamente normalidade e você não pode usar o t.test () função. Para esses casos, você tem a wilcox.test () função, que utiliza exactamente da mesma maneira, como mostrado no exemplo a seguir:
> Wilcox.test (temperatura ~ activ, data = beaver2)
Isto dar-lhe o seguinte resultado:
teste de soma de postos de Wilcoxon com correctiondata continuidade: temp por activW = 15, p-valor lt; 2.2e-16alternative hipótese: a verdadeira mudança de localização não é igual a 0
Novamente, você obter o valor para a estatística de teste (W neste teste) e um valor de p. Sob essa informação, você leu a hipótese alternativa, e que difere um pouco da hipótese alternativa de um teste t. O teste de Wilcoxon analisa se o centro dos seus dados (o local) difere entre ambas as amostras.
Com esse código, você realizar o teste de soma de postos de Wilcoxon ou Mann-Whitney. Ambos os testes são completamente equivalentes, de modo que R não contêm uma função separada para o teste U de Mann-Whitney.
Como usar o teste T-Test e Wilcoxon de R a direção do teste
Com o teste básico T-Test e Wilcoxon, você testar se as amostras diferem sem especificar de que forma. Os estatísticos chamam a isto uma teste de dois lados. Imagine que você não quer saber se a temperatura do corpo é diferente entre os períodos ativos e inativos, mas se a temperatura do corpo é menor durante os períodos inativos.
Para fazer isso, você tem que especificar a alternativa argumento tanto no t.test () ou wilcox.test () função. Este argumento pode assumir três valores:
Por padrão, ele tem o valor 'Two.sided', o que significa que você deseja que o teste bilateral padrão.
Se você quiser testar se a média (ou local) do primeiro grupo é menor, você dar-lhe o valor 'Menos'.
Se você quiser testar se essa média é maior, você especificar o valor 'Maior'.
Se você usar a interface fórmula para estes testes, os grupos são ordenados na mesma ordem que os níveis do fator de usar. Você tem que levar isso em conta para saber qual grupo é visto como o primeiro grupo. Se os dados para dar ambos os grupos como vectores separados, o primeiro vector é o primeiro grupo.