Como usar o teste t de lidar com amostras pequenas e Unknown desvios-padrão

Ao usar uma estatística de teste para uma média da população, há dois casos em que você deve usar o t-distribuição, em vez de a Z-distribuição. O primeiro caso é quando o tamanho da amostra é pequeno (inferior a 30 ou menos), e no segundo caso, quando o desvio padrão da população,

image0.png

não é conhecida, e você tem que estimar-lo usando o desvio padrão da amostra, s. Em ambos os casos, você tem menos informação confiável sobre a qual basear suas conclusões, então você tem que pagar uma multa por isso usando o t-distribuição, que tem uma maior variabilidade nas caudas do que um Z-distribuição tem.

Um teste de hipótese para uma média da população, que envolve a t-distribuição é chamado um t-teste. A fórmula para a estatística de teste nesse caso é:

image1.png

Onde tn-1 é um valor a partir da t-com distribuição n-1 graus de liberdade.

Note que é apenas como a estatística de teste para o grande amostra e / ou o caso de distribuição normal, excepto

image2.png

Não se sabe, portanto, você substituir o desvio padrão da amostra, s, Em vez disso, e usar um t-valor, em vez de um z-valor.

Porque o t-distribuição tem caudas mais gordas do que o Z-distribuição, você obter um maior P-valor do t-distribuição do que aquele que o padrão normal (Z-) Distribuição teria lhe dado para a mesma estatística de teste. A maior P-valor significa menos chance de rejeitar uma hipótese nula, H0. Tendo menos dados e / ou não saber o desvio padrão da população deve criar uma maior carga da prova.

Suponha que uma empresa de entrega afirma que entregar seus pacotes em 2 dias, em média, e você suspeito que é mais do que isso. As hipóteses são

image3.png

Para testar essa afirmação, você toma uma amostra aleatória de 10 pacotes e gravar seus prazos de entrega. Você encontra a média da amostra é

image4.png

eo desvio padrão da amostra é de 0,35 dias. (Uma vez que o desvio padrão da população,

image5.png

é desconhecida, você estimar com s, o desvio padrão da amostra.) Este é um trabalho para o t-teste.

Como o tamanho da amostra é pequeno (n = 10 é muito menos do que 30) e o desvio padrão da população não é conhecido, o teste estatístico tem uma t-distribuição. Seus graus de liberdade é 10-1 = 9. A fórmula para a estatística de teste (denominado t-value) é:

image6.png

Para calcular o P-valor, você está na linha na t-mesa para df = 9.

image7.jpg

Sua estatística de teste (2,71) cai entre dois valores na linha df = 9 na t-tabela: 2,26 e 2,82 (arredondamento para duas casas decimais). Para calcular o P-valor para sua estatística de teste, descobrir quais colunas correspondem a estes dois números. O número 2,26 aparece na coluna 0,025 eo número 2.82 aparece no 0.010 Coluna você já sabe o P-valor para o seu teste estatístico situa-se entre 0,025 e 0,010 (ou seja, 0,010 lt; p-valor lt; 0,025).

usando o t-mesa você não sabe o número exato para a P-valor, mas porque 0,010 e 0,025 estão a menos do que o seu nível de significância de 0,05, você rejeita H0- você tem provas suficientes na sua amostra de dizer que os pacotes não estão sendo entregues em 2 dias, e na verdade o tempo médio de entrega é mais do que 2 dias.

A tentação é dizer, # 147 Bem, eu sabia que a alegação de 2 dias em média era demasiado baixo, porque a média da amostra de 2,3 minutos foi claramente maior. Por que eu ainda preciso de um teste de hipótese? # 148- Tudo o que número diz-lhe algo sobre esses 10 pacotes amostrados. Você também precisa levar em consideração a variação usando o erro padrão eo t-distribuição de ser capaz de dizer algo sobre toda a população de pacotes enviados.

o t-tabela não inclui todos os possíveis t-valor- apenas encontrar os dois valores mais próximo ao seu de cada lado, olhar para as colunas em que estão, e informe o seu P-valor em relação ao deles. (Se a sua estatística de teste é maior do que todo o t-valores na linha correspondente do t-tabela, é só usar a última um- seu P-valor será menor do que a sua probabilidade.)

menu