O poder de um Teste de hipótese estatística
O poder de um teste estatístico é a chance de que ele vai sair estatisticamente significativa quando deveria - ou seja, quando a hipótese alternativa é realmente verdade. Poder é uma probabilidade e é muitas vezes expressa como uma percentagem. Beta é a chance de conseguir um resultado não significativo quando a hipótese alternativa é verdade, então você vê que o poder e beta estão relacionadas matematicamente: Potência = 1 - beta.
A potência de qualquer teste estatístico depende de vários factores:
O nível alfa que você estabeleceu para o teste - ou seja, a chance que você está disposto a aceitar de fazer um erro de tipo I
A magnitude real do efeito na população, em relação à quantidade de ruído nos dados
O tamanho de sua amostra
Poder, tamanho da amostra, o tamanho do efeito relativo ao ruído, e alfa nível não podemos todos ser variados independently- eles estão inter-relacionados - conectado e limitado por uma relação matemática que envolve os quatro quantidades.
Esta relação é frequentemente muito complicado, e às vezes não pode ser escrita explicitamente como uma fórmula, mas ela existe. Para qualquer tipo de teste, você pode (pelo menos em teoria) determinar qualquer um dos quatro quantidades se você sabe os outros três. Então, existem quatro maneiras diferentes de fazer cálculos de potência, com cada caminho calcular um dos quatro quantidades de valores arbitrariamente especificados dos outros três.
relações de tamanho de potência, tamanho da amostra, e efeito
O nível alfa de um teste estatístico é geralmente definido como 0,05, a menos que existam considerações especiais. Depois de especificar o valor de alfa, você pode exibir a relação entre as outras três variáveis (potência, tamanho da amostra e tamanho do efeito) de várias maneiras:
Poder contra o tamanho da amostra, para vários tamanhos de efeito: Para todos os testes estatísticos, o poder de umeumaneiras aumenta à medida que o tamanho da amostra aumenta, se outras coisas (como o nível alfa e tamanho do efeito) são mantidos constantes. "Eff" é o tamanho do efeito - a diferença entre grupos dividido pelo desvio padrão dentro do grupo.
Muito pequenas amostras muito raramente produzem resultados significativos a menos que o tamanho do efeito é muito grande. Por outro lado, extremamente grandes amostras (muitos milhares de indivíduos) são quase sempre significativa a menos que o tamanho do efeito é quase zero. Em estudos epidemiológicos, que muitas vezes envolvem centenas de milhares de indivíduos, testes estatísticos tendem a produzir extremamente pequenas (e, portanto, extremamente significativos) os valores de p, mesmo quando o tamanho do efeito é tão pequeno que é de nenhuma importância prática.
Poder contra o tamanho do efeito, para vários tamanhos de amostra: Para todos os testes estatísticos, O poder sempre invincos como o tamanho do efeito aumenta, se outras coisas (como o nível alfa e tamanho da amostra) são mantidos constantes. "N" é o número de sujeitos em cada grupo.
Para grandes tamanhos de efeito, o poder se aproxima de 100 por cento. Por muito pequenos tamanhos de efeito, você pode pensar que o poder do teste se aproximaria de zero, mas você pode ver a partir da figura que ele não vai para baixo todo o caminho para zero, na verdade se aproxima do nível alfa do teste.
(Tenha em mente que o nível alfa do teste é a probabilidade de o teste produzir um resultado significativo quando nenhum efeito está verdadeiramente presente.)
O tamanho da amostra contra o tamanho do efeito, para vários valores de potência: Para todos os testes estatísticos, tamanho da amostra e tamanho do efeito são inversamente proporcionais, se outras coisas (como o nível alfa e poder) são mantidos constantes. Pequenos efeitos podem ser detectadas apenas com grandes efeitos grandes Amostras- pode muitas vezes ser detectada com amostras pequenas.
Esta relação inversa entre o tamanho da amostra e o tamanho do efeito assume uma forma muito simples matemática (pelo menos para uma boa aproximação): A dimensão da amostra necessária é inversamente proporcional ao quadrado do tamanho do efeito que pode ser detectado.
Ou, de forma equivalente, o tamanho do efeito detectável é inversamente proporcional à raiz quadrada do tamanho da amostra. Então, quadruplicando o tamanho de amostra permite que você detecte tamanhos de efeito apenas metade tão grande.
Como fazer cálculos de potência
Os cálculos de energia são uma parte crucial do projeto de qualquer projecto de investigação. Você não quer que seu estudo a ser fraca potência (com um elevado risco de perder efeitos reais) ou subjugado (maior, mais caro e mais demorado do que o necessário). Você precisa fornecer uma análise de energia / sample-size para qualquer proposta de pesquisa que você enviar para financiamento ou qualquer protocolo de submeter ao Conselho de Revisão para aprovação.
Você pode executar cálculos de potência de várias maneiras:
O software de computador: Os pacotes de estatísticas maiores (como SPSS, SAS, e R) oferecem uma ampla gama de cálculos de potência. Há também programas especialmente concebidos para esse fim (nQuery, StatExact, Poder e precisão, PS-Power Tamanho da amostra, e GPower, por exemplo).
Páginas Web: Muitos dos cálculos de energia mais comuns podem ser realizadas on-line usando calculadoras baseadas na web. Uma grande colecção destes pode ser encontrada em StatPages.net.
Dispositivos portáteis: Aplicativos para os cálculos de energia mais comuns estão disponíveis para a maioria dos tablets e smartphones.
gráficos e tabelas impressas: Você pode encontrar gráficos e tabelas em livros didáticos. Estes são ideais para cálculos rápidos e sujos.
Regras de ouro: Alguns cálculos do tamanho da amostra aproximados são simples o suficiente para fazer em um pedaço de papel ou mesmo na sua cabeça!