Teste de significância com o teste da hipótese
Todos os famosos testes de significância estatística (t de Student, qui-quadrado, ANOVA, e assim por diante) trabalhar no mesmo princípio geral - eles avaliam o tamanho do efeito aparente que você vê em seus dados contra o tamanho das flutuações aleatórias presentes em seus dados . A seguir estão as etapas gerais que fundamentam todos os testes estatísticos comuns de significado.
Ferver a dados brutos para baixo em um único número, chamado de estatística de teste.
Cada teste tem sua própria fórmula, mas em geral, a estatística de teste representa a magnitude do efeito que você está procurando em relação à magnitude do ruído aleatório em seus dados. Por exemplo, a estatística de teste para o teste não pareado t de Student para comparação de médias entre dois grupos está relacionada com a relação:
(A fórmula real para a estatística t de Student também inclui termos que envolvem o número de indivíduos em cada grupo). O numerador do rácio é uma medida do efeito que você está procurando - a diferença entre os dois grupos. E o denominador é uma medida do ruído aleatório em seus dados - a disseminação de valores dentro de cada grupo. Quanto maior for o efeito observado é, em relação à quantidade de dispersão aleatória nos seus dados, quanto maior for a estatística t de Student será.
Determinar a probabilidade (ou improvável) é por flutuações aleatórias para produzir uma estatística de teste tão grande quanto o que você realmente tem a partir de seus dados (o "valor de p").
Os matemáticos têm feito o de trabalho duro que eles desenvolveram fórmulas de distribuição de probabilidade (realmente as complicadas) que descrevem o quanto a estatística de teste salta ao redor se apenas flutuações aleatórias estão presentes (isto é, se H0 é verdade). Uma vez que você calculada a estatística de teste, você pode usar as fórmulas de distribuição de probabilidade (ou referência a uma tabela de valores) para obter o valor p para o teste.
Interpretar o "valor de p" e tire suas conclusões.
Se o valor p é menor que 0,05 (ou algum outro valor pré-determinado), então há uma possibilidade muito pequena (menos do que 1 em 20) de que as flutuações aleatórias sozinho, na ausência de qualquer efeito real, poderia ter produzido um efeito tão grande quanto o que você realmente observado. Então você concluir que o efeito que você observado foi estatisticamente significativa.