Como teste para uma diferença média Usando o Emparelhado t-Test

Você pode testar uma diferença média usando o emparelhado t-testar quando a variável é numérica (por exemplo, renda, nível de colesterol, ou milhas por galão) e os indivíduos da amostra estatística ou são emparelhados acima de alguma forma de acordo com variáveis ​​relevantes, como idade ou talvez de peso, ou as mesmas pessoas são utilizado duas vezes (por exemplo, usando um pré-teste e pós-teste).

testes emparelhados são normalmente utilizados para estudos em que alguém está testando para ver se um novo tratamento, técnica ou método funciona melhor do que um método existente, sem ter que se preocupar com outros fatores sobre os assuntos que podem influenciar os resultados.

Com a diferença de média, você igualar-se os assuntos de modo que eles são pensados ​​como proveniente de uma única população, e o conjunto de diferenças medidas para cada sujeito (por exemplo, pré-teste contra o pós-teste) são pensados ​​como uma amostra. O teste de hipótese, em seguida, resume-se a um teste para uma média da população.

Por exemplo, suponha que um pesquisador quer ver se ensinar os alunos a ler usando um jogo de computador dá melhores resultados do que o ensino com um método fonética tentou-e-verdadeiro. Ela seleciona aleatoriamente 20 estudantes e coloca-los em 10 pares de acordo com o seu nível de prontidão de leitura, idade, QI, e assim por diante. Ela seleciona aleatoriamente um aluno de cada par de aprender a ler através do método de jogo de computador (CM abreviado), ea outra no par aprende a ler pelo método de fonética (PM abreviado). No final do estudo, cada aluno tem o mesmo teste de leitura. Os dados estão apresentados na tabela a seguir.

Notas de leitura para o jogo de computador Methodversus Método Phonics
Par StudentMétodo de computadorMétodo phonicsDiferença (CM - PM)
18580+5
280800
39588+7
48790-3
57872+6
68279+3
75750+7
86973-4
97378-5
109995+4

Os dados originais estão em pares, mas você está realmente interessado apenas na diferença de notas em leitura (fonética pontuação leitura computorizada menos leitura score) para cada par, e não os de leitura pontuação próprios. Então o diferenças emparelhados (As diferenças entre os pares de pontuação) são o seu novo conjunto de dados. Pode ver os seus valores na última coluna da tabela.

Ao examinar as diferenças entre os pares de observações, você realmente só tem um único conjunto de dados, e você só tem um teste de hipótese para uma média da população. Neste exemplo específico, a hipótese nula é que a média (as diferenças emparelhadas) é 0, e a hipótese alternativa é que a média (as diferenças emparelhadas) é maior do que 0.

Se os dois métodos de leitura são os mesmos, a média das diferenças emparelhadas deve ser perto de 0. Se o método de computador é melhor, a média das diferenças emparelhadas deve ser significativamente mais do que o que é 0-, a pontuação leitura computador seria maior que os fonética marcar.

A notação para a hipótese nula é

image0.png

(O d no subscrito apenas lembra que você está trabalhando com as diferenças emparelhados.)

A fórmula para a estatística de teste para as diferenças emparelhadas é

image1.png

amostra, e tn-1 é um valor na t-com distribuição nd - 1 graus de liberdade.

Você usa um t-distribuição aqui, porque na maioria dos experimentos-pares combinados o tamanho da amostra é pequeno ou o desvio padrão e / população

image2.png

é desconhecido, por isso é estimado pela sd.

Para calcular a estatística de teste para as diferenças emparelhadas, faça o seguinte:

  1. Para cada par de dados, tomar o primeiro valor do par menos o segundo valor do par para encontrar a diferença emparelhado.

    Pense nas diferenças como o seu novo conjunto de dados.

  2. Calcule a média,

    image3.png

    e o desvio padrão, sd, de todas as diferenças.

  3. De locação ndrepresentam o número de diferenças pareadas que você tem, calcular o erro padrão:

    image4.png
  4. Dividir

    image5.png

    pelo erro padrão a partir do Passo 3.

Porque

image6.png

é igual a 0 se H0 É verdade, ele realmente não precisa ser incluído na fórmula para a estatística de teste. Como resultado, às vezes você vê a estatística de teste escrito assim:

image7.png

Para o exemplo de notas de leitura, você pode usar as etapas anteriores para ver se o método de computador é melhor em termos de ensinar os alunos a ler.

Para encontrar a estatística, siga estes passos:

  1. Calcular as diferenças para cada par (eles são mostrados na coluna 4 da tabela acima). Note-se que o sinal em cada uma das diferenças é importante- que indica que realizada método melhor para que determinado par.

  2. Calcula-se a média e desvio padrão das diferenças do Passo 1. Neste exemplo, a média das diferenças é

    image8.png

    e o desvio padrão é sd = 4,64. Observe que nd= 10 aqui.

  3. O erro padrão é

    image9.png

    (Lembre-se que aqui, ndé o número de pares, que é 10.)

  4. Aqui a média das diferenças (Passo 2) a dividir pelo erro padrão de 1,47 (Passo 3) para obter 1,36, a estatística de teste.

É o resultado do Passo 4 suficiente para dizer que a diferença na leitura de partituras encontrados neste experimento se aplica a toda a população em geral? Uma vez que o desvio padrão da população,

image10.png

é desconhecido e você estima-com o desvio padrão da amostra (s), Você precisa usar o t-distribuição, em vez de a Z-distribuição para encontrar o seu P-valor. Utilizando a seguir t-tabela, você olhar para cima 1,36 na t-distribuição com 10 - 1 = 9 graus de liberdade para calcular o P-valor.

image11.jpg

o P-valor, neste caso, é maior do que 0,10 (e, portanto, maior do que 0,05) 1,36 porque é menor do que (ou à esquerda de) o valor de 1,38 sobre a mesa e, portanto, a sua P-valor é superior a 0,10 (a p-valuefor no título da coluna correspondente a 1,38).

Porque o P-valor é maior do que 0,05, você deixar de rejeitar H0- você não tem provas suficientes de que a diferença média na pontuação entre o método de computador e o método fonética é significativamente maior que 0. No entanto, isso não significa necessariamente uma diferença real não está presente na população de todos os alunos. Mas o pesquisador não pode dizer que o jogo de computador é um método melhor leitura com base nessa amostra de 10 alunos.

Você pode perguntar: # 147 Hey, a média da amostra das diferenças é 2.0, que mostra que o método de computador foi melhor do que o método de fonética. Por que o teste de hipótese rejeitar H0 desde 2.0 é obviamente maior que 0? # 148- Porque neste caso, 2,0 não é significativamente maior do que 0. Você também precisa levar em consideração a variação usando o erro padrão eo t distribuição de ser capaz de dizer algo sobre toda a população de estudantes.

menu