O intervalo de confiança em torno de uma média
Assim como o SE (erro padrão) fórmulas depender de que tipo de estatística da amostra você está lidando com (se você está medindo ou contar algo ou obtê-lo a partir de um programa de regressão ou de algum outro cálculo), intervalos de confiança (CIS) são calculados de formas diferentes dependendo de como você obter a estatística da amostra.
Suponha que você estudar 25 diabéticos adultos (N = 25) e achar que eles têm um nível médio de glicose no sangue em jejum de 130 mg / dL com um desvio padrão (SD) de # 177- 40 mg / dL. Qual é o intervalo de confiança de 95 por cento em torno de que 130 mg / dL estimado significa?
Para calcular os limites de confiança em torno de uma média usando as fórmulas para grandes amostras, você primeiro calcular o erro padrão da média (SEM), que é
Onde SD é o desvio padrão da N valores individuais. Assim, por exemplo a glicose, o SE da média é
que é igual a 40/5, ou 8 mg / dL.
utilização k = 1,95 para um nível de confiança de 95 por cento, os limites de confiança inferiores e superiores em torno da média são
CLeu = 130 - 114,3 = 1.96x8
CLvocê = 130 + 1.96x8 = 145,7
Você relatar o resultado desta forma: glicose média = 130 mg / dL, IC95% = 114-146 mg / dL. (Não relatar números para mais casas decimais do que os seus mandados de precisão. Neste exemplo, os dígitos após o ponto decimal são praticamente sem sentido, por isso os números são arredondados.)
Uma versão mais preciso das fórmulas para amostras grandes usa valores de k derivados de uma tabela de valores críticos da distribuição t de Student. Você precisa saber o número de graus de liberdade, o que, para um valor médio, é sempre igual a N - 1.
Usando uma tabela t de Student ou uma página web como StatPages, você pode achar que o valor k à base de Student para um nível de confiança de 95 por cento e 24 graus de liberdade é igual a 2,06, um pouco maior do que o valor com base normal k.
Utilizando este valor k em vez de 1,96, é possível calcular os limites de confiança de 95 por cento, 113,52 e 146,48, que acontecem para terminar com os mesmos números inteiros como os limites com base normais-confiança. Geralmente você não tem que usar os valores de k-base do estudante mais complicados, a menos N é bastante pequeno (por exemplo, menos do que 10).
E se os seus números originais (as que estão sendo em média) não são normalmente distribuídos? Você não deve apenas cegamente aplicar as fórmulas com base normais-CI para dados não-normalmente distribuídos. Se você sabe que seus dados estão distribuídos (um tipo muito comum de não-normalidade) log-normalmente, você pode fazer o seguinte:
Tome o logaritmo do valor de cada indivíduo.
Localizar a média, SD, e SEM destes logaritmos.
Use as fórmulas com base normais para obter os limites de confiança (CLS) em torno da média dos logaritmos.
Calcule o antilogaritmo da média dos logs.
O resultado representa a média geométrica dos valores originais.
Calcular os antilogaritmos do CLS inferiores e superiores.
Estes são os CL superior e inferior em torno da média geométrica.