Como comparar duas amostras de dados com R

R dá-lhe dois testes padrão para comparação de dois grupos com dados numéricos: o teste t com o t.test ()

função, e o teste de Wilcoxon com o wilcox.test () função. Se você quiser usar o t.test () função, você primeiro tem que verificar, entre outras coisas, se ambas as amostras são normalmente distribuídos. Para o teste de Wilcoxon, isso não é necessário.

Como usar a função de Wilcoxon de R para dados anormalmente distribuídos

Em alguns casos, seus dados se desvia significativamente normalidade e você não pode usar o t.test () função. Para esses casos, você tem a wilcox.test () função, que utiliza exactamente da mesma maneira, como mostrado no exemplo a seguir:

> Wilcox.test (temperatura ~ activ, data = beaver2)

Isto dar-lhe o seguinte resultado:

 teste de soma de postos de Wilcoxon com correctiondata continuidade: temp por activW = 15, p-valor lt; 2.2e-16alternative hipótese: a verdadeira mudança de localização não é igual a 0

Novamente, você obter o valor para a estatística de teste (W neste teste) e um valor de p. Sob essa informação, você leu a hipótese alternativa, e que difere um pouco da hipótese alternativa de um teste t. O teste de Wilcoxon analisa se o centro dos seus dados (o local) difere entre ambas as amostras.

Com esse código, você realizar o teste de soma de postos de Wilcoxon ou Mann-Whitney. Ambos os testes são completamente equivalentes, de modo que R não contêm uma função separada para o teste U de Mann-Whitney.

Como usar o teste T-Test e Wilcoxon de R a direção do teste

Com o teste básico T-Test e Wilcoxon, você testar se as amostras diferem sem especificar de que forma. Os estatísticos chamam a isto uma teste de dois lados. Imagine que você não quer saber se a temperatura do corpo é diferente entre os períodos ativos e inativos, mas se a temperatura do corpo é menor durante os períodos inativos.

Para fazer isso, você tem que especificar a alternativa argumento tanto no t.test () ou wilcox.test () função. Este argumento pode assumir três valores:

  • Por padrão, ele tem o valor 'Two.sided', o que significa que você deseja que o teste bilateral padrão.

  • Se você quiser testar se a média (ou local) do primeiro grupo é menor, você dar-lhe o valor 'Menos'.

  • Se você quiser testar se essa média é maior, você especificar o valor 'Maior'.

Se você usar a interface fórmula para estes testes, os grupos são ordenados na mesma ordem que os níveis do fator de usar. Você tem que levar isso em conta para saber qual grupo é visto como o primeiro grupo. Se os dados para dar ambos os grupos como vectores separados, o primeiro vector é o primeiro grupo.

menu