Tipo I e tipo II Erros em testes de hipóteses

O resultado de um teste estatístico é uma decisão de aceitar ou rejeitar H0 (A hipótese nula) em favor de HAlt (A hipótese alternativa). porque H0 refere-se à população, é verdadeira ou falsa para a população que está obtendo amostras de. Você nunca pode saber o que a verdade é, mas uma verdade objetiva está lá fora, no entanto.

A verdade pode ser uma de duas coisas, e sua conclusão é uma das duas coisas, para quatro situações diferentes são possível- estas são muitas vezes retratado em uma mesa de quatro vezes.

image0.jpg

Aqui estão as quatro coisas que podem acontecer quando você executar um teste de significância estatística sobre os seus dados (usando um exemplo de teste de uma droga para eficácia):

  • Você pode obter uma nonsignificant resultar quando não é verdadeiramente não efetuar presente. Isso é correto - você não quer afirmar que uma droga funciona se ele realmente não faz. (Veja no canto superior esquerdo da caixa esboçada na figura.)

  • Você pode obter uma significativo resultar quando há realmente é algum efeito presente. Isso é correto - você quer reivindicar que uma droga funciona quando ele realmente faz. (Veja no canto inferior direito da caixa esboçada na figura.)

  • Você pode obter uma significativo resultar quando não há realmente não efetuar presente. Este é um erro Tipo I - que foi enganado por flutuações aleatórias que fizeram uma droga realmente inúteis parecem ser eficazes. (Veja no canto inferior esquerdo da caixa esboçada na figura.)

    Sua empresa vai investir milhões de dólares no desenvolvimento de uma droga que irá eventualmente ser mostrado para ser inútil. Os estatísticos usar a letra grega alfa para representar a probabilidade de fazer um erro de tipo I.

  • Você pode obter uma nonsignificant resultar quando há realmente é um efeito presente. Este é um erro tipo II (ver no canto superior direito da caixa esboçada na figura) - você não conseguiu ver que a droga realmente funciona, talvez porque o efeito foi obscurecido pelo ruído aleatório nos dados.

    Desenvolvimento adicional será interrompido, ea droga milagrosa do século será expedido para a sucata, juntamente com o prémio Nobel você nunca vai conseguir. Os estatísticos usar a letra grega beta para representar a probabilidade de fazer um erro tipo II.

Limitando a sua chance de fazer uma (significância falsamente) erro de tipo I é muito fácil. Se você não quiser fazer um erro tipo I mais de 5 por cento do tempo, não declare significado a menos que o valor de p é inferior a 0,05. Isso é chamado de teste ao nível de 0,05 alfa.

Se você está disposto a fazer um erro tipo I de 10 por cento do tempo, use p lt; 0,10 como seu critério de significância. Isso é muitas vezes feito em estudos "exploratórias", em que você está mais disposto a dar o medicamento o benefício da dúvida. Por outro lado, se você está realmente com medo de erros do tipo I, p uso lt; 0.000001 como seu critério de significância, e você não vai afirmam falsamente significado mais de uma vez em um milhão.

Por que não usar sempre um pequeno nível alfa (como p lt; 0.000001) para o seu teste de significância? Porque então você quase nunca vai ter significado, mesmo se um efeito realmente está presente. Os pesquisadores não gostam de passar a vida nunca mais fazer quaisquer descobertas. Se um medicamento é realmente eficaz, você deseja obter um resultado significativo quando você testá-lo.

Você precisa encontrar um equilíbrio entre o Tipo I e erros do tipo II - entre as taxas de erro alfa e beta. Se você fizer alpha muito pequeno, beta vai se tornar muito grande, e vice-versa.

menu