Vá fora da norma com não paramétricos Estatísticas

Todos os testes estatísticos são derivados com base em algumas suposições sobre seus dados, e a maioria dos testes de significância clássicos (como os testes t de Student, análise de variância e testes de regressão) assumem que os seus dados são distribuídos de acordo com alguma distribuição de frequência clássica ( mais geralmente a distribuição normal).

Porque as funções de distribuição clássicos são todos escritos como expressões matemáticas envolvendo parâmetros (como média e desvio padrão), eles são chamados paramétrico funções de distribuição, e testes que assumem os seus dados está em conformidade com uma função de distribuição paramétrica são chamados de testes paramétricos. Uma vez que a distribuição normal é a distribuição estatística mais comum, o termo parumateste métrica é mais frequentemente usado para significar um teste que assume dados distribuídos normalmente.

Mas às vezes os dados não é paramétrica. Por exemplo, você pode não querer assumir que os seus dados são normalmente distribuídos, pois pode ser muito visivelmente inclinada, como mostrado na parte uma da figura.

image0.jpg

Às vezes, você pode ser capaz de realizar algum tipo de transformação de seus dados para torná-lo mais distribuída normalmente. Por exemplo, muitas variáveis ​​que têm uma distribuição assimétrica pode ser convertido em números normalmente distribuída tendo em logaritmos, como mostrado na parte b. Se, por tentativa e erro, você pode encontrar algum tipo de transformação que normaliza os seus dados, você pode executar os testes clássicos sobre os dados transformados.

Mas às vezes os seus dados estão teimosamente anormal, e você não pode usar os testes paramétricos. Felizmente, os estatísticos desenvolveram testes especiais que não assumem normalmente distribuído de dados estes são (não surpreendentemente) chamou testes não paramétricos. A maioria dos testes paramétricos clássicos comuns têm contrapartidas não paramétricos.

Como você pode esperar, os testes não paramétricos mais conhecidos e utilizados são os que correspondem aos testes clássicos mais conhecidos e utilizados.

As contrapartes não-paramétricos de testes clássicos
Teste Parametric clássicoequivalente não paramétrico
Um grupo ou emparelhado teste t de StudentRegiste-test- Wilcoxon teste assinados-fileiras
Dois grupos teste t de StudentWilcoxon soma de fileiras teste-teste de Mann-Whitney
One-way ANOVAteste de Kruskal-Wallis
teste de Correlação de Pearsonteste de Correlação de Spearman

A maioria dos testes não paramétricos envolvem a primeira classificação de seus valores de dados, menor para o maior, e gravando o posto de cada medição (o valor mais baixo tem uma classificação de 1, o próximo valor mais alto de um posto de 2, e assim por diante). Todos os cálculos subsequentes são feitas com estas fileiras e não com os valores de dados reais.

Embora os testes não paramétricos não assumem a normalidade, eles fazem certas suposições sobre seus dados. Por exemplo, muitos testes não paramétricos supor que você não tem quaisquer valores amarrados em seu conjunto de dados (em outras palavras, não há dois indivíduos têm exatamente os mesmos valores). A maioria dos testes paramétricos incorporar ajustes para a presença de laços, mas isso enfraquece o teste e faz com que o resultado não exata.

Mesmo em estatística descritiva, os parâmetros comuns têm contrapartidas não paramétricos. Apesar de médias e desvios padrão pode ser calculado para qualquer conjunto de números, eles são mais úteis para resumir dados quando os números são normalmente distribuídos. Quando você não sabe como os números são distribuídos, medianas e quartis são muito mais úteis como medidas de tendência central e de dispersão.

menu