O Método Bootstrap para erros padrão e intervalos de confiança
Você pode calcular o erro padrão (SE) e intervalo de confiança (IC) das estatísticas da amostra mais comuns (médias, proporções, as contagens de eventos e taxas, e coeficientes de regressão). Mas uma SE e CI existe (teoricamente, pelo menos) para qualquer número que poderia arrancar a partir de seus dados - medianas, percentis, coeficientes de correlação, e outras quantidades que possam envolver cálculos complicados, como a área sob a curva de concentração versus tempo (AUC) ou estimada a probabilidade de sobrevivência de cinco anos derivado de um análise de sobrevivência. Fórmulas para o SE e CI em torno destes números pode não estar disponível ou pode ser irremediavelmente difíceis de avaliar. Além disso, as fórmulas que existem pode aplicar-se apenas aos números distribuídos normalmente, e você pode não ter certeza de que tipo de distribuição de seus dados a seguir.
Considere-se um problema muito simples. Suponha que você tenha medido o QI de 20 indivíduos e ter obtido os seguintes resultados: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114 , 115, 120, e 138. Estes números têm uma média de 100,85 e uma mediana de 99,5. Porque você é um bom cientista, você sabe que sempre que você relatar algum número que você calculado a partir de seus dados (como uma média ou mediana), você também vai querer indicar a precisão desse valor na forma de uma SE e CI.
Para a média, e se você pode assumir que os valores de QI são aproximadamente distribuídos normalmente, as coisas são muito simples. Você pode calcular a SE da média de 3,54 e IC 95% em torno da média como 93,4-108,3.
Mas o que dizer do SE e CI para a mediana, para as quais não existem fórmulas simples? E se você não pode ter certeza que esses valores de QI provenientes de uma distribuição normal? Em seguida, as fórmulas simples pode não ser confiável.
Felizmente, existe um método muito geral para estimar SEs e ICs para qualquer coisa você pode calcular a partir de seus dados, e não necessita de quaisquer suposições sobre como os números são distribuídos. O SE de qualquer estatística da amostra é o desvio padrão (SD) da distribuição amostral para essa estatística. E os limites de confiança de 95% de uma amostra estatística são bem aproximada pela 2.5th e percentis 97,5 de distribuição de amostras dessa estatística.
Então, se você poderia replicar toda a sua experiência muitas vezes milhares (com uma amostra diferente de temas de cada vez), e cada Calcular tempo e salvar o valor da coisa que você está interessado (mediana, AUC, ou qualquer outro), esta colecção de milhares de valores seria uma boa aproximação para a distribuição de amostragem da quantidade de interesse. Então você pode estimar o SE simplesmente como o SD da distribuição de amostragem e os limites de confiança dos percentis da distribuição.
Mas, na verdade, levar a cabo este cenário não é viável - você provavelmente não tem tempo, paciência ou dinheiro para realizar todo o seu milhares de estudo de vezes. Felizmente, você não tem que repetir os milhares de estudos de vezes para obter uma estimativa da distribuição amostral. Você pode fazê-lo através da reutilização dos dados de seu um estudo real, uma e outra vez! Isso pode parecer bom demais para ser verdade, e os estatísticos foram muito cético em relação a este método quando foi proposto pela primeira vez. Eles o chamaram bootstrapping, comparando-a com a tarefa impossível de # 147-picking-se pelo seu próprio esforço # 148.;
Mas acontece que se você continuar reutilizando os mesmos dados de certa forma, este método realmente funciona. Ao longo dos anos, o procedimento de inicialização tornou-se uma forma aceita para obter estimativas confiáveis de SEs e ICs para quase qualquer coisa que você pode calcular a partir do seu de dados, na verdade, é muitas vezes considerado o # 147-padrão ouro # 148- contra o qual várias fórmulas de aproximação para SEs e IC são julgados.
Para ver como o método bootstrap funciona, aqui está como você iria utilizá-lo para estimar o SE e IC 95% da média ea mediana dos valores 20 de QI mostrados anteriormente. Você tem que resample seus 20 números, uma e outra vez, da seguinte maneira:
Escrever cada uma das suas medições em um pedaço de papel separado e colocá-los todos em um saco.
Neste exemplo, você escreve os 20 QI medidos em tiras separadas.
Alcançar e tirar um deslize, escrever esse número para baixo, e colocar o deslizamento de volta na bolsa.
(Essa última parte é muito importante!)
Repita a etapa 2 quantas vezes forem necessárias para corresponder ao número de medições que você tem, devolvendo o deslizamento para o saco de cada vez.
Isto é chamado de reamostragem com replacement, e isso produz um resampled conjunto de dados.Neste exemplo, repetir o passo 2 19 vezes mais, para um total de 20 vezes (que é o número de medições de QI tiver).
Calcule a estatística da amostra desejada dos números reamostrados de Passos 2 e 3, e gravar esse número.
Neste exemplo, você encontra a média ea mediana dos 20 números refeita.
Repita os passos 2 a 4 milhares de vezes.
Cada vez, você gerar um novo resampled conjunto de dados do qual você calcular e registrar as estatísticas de amostra desejada (neste caso, a média ea mediana do conjunto de dados resampled). Você acabar com milhares de valores para a média e milhares de valores para a mediana.
Em cada conjunto de dados resampled, alguns dos valores originais pode ocorrer mais de uma vez, e alguns podem não estar presente em tudo. Quase todos os conjunto de dados resampled será diferente de todos os outros. O método bootstrap se baseia no fato de que estes valores médios e medianos dos milhares de conjuntos de dados reamostrados compreendem uma boa estimativa da distribuição amostral da média e mediana. Coletivamente, eles se assemelham ao tipo de resultados que pode ter obtido se tivesse repetido o estudo real e outra vez.
Calcular o desvio padrão dos seus milhares de valores da estatística da amostra.
Este processo dá-lhe uma # 147-bootstrap # 148- estimativa do SE da amostra estatística. Neste exemplo, você calcula o SD dos milhares de meios para obter a SE da média, e você calcular o SD dos milhares de medianas para obter o SE da mediana.
Obter o 2.5th e percentis 97,5 dos milhares de valores da estatística da amostra.
Para fazer isso, a classificação de seus milhares de valores da estatística da amostra em ordem numérica, e depois cortando o menor de 2,5 por cento e o mais alto de 2,5 por cento do conjunto classificado de números. Os valores de menor e maior que permanecem são a estimativa bootstrap de limites de confiança baixa e alta de 95% para a estatística da amostra.
Neste exemplo, o 2.5th e 97,5 percentis das médias e as medianas dos milhares de conjuntos de dados reamostrados são os limites de confiança de 95% para a média e mediana, respectivamente.
Obviamente você nunca tentar fazer este processo de bootstrapping com a mão, mas é muito fácil de fazer com software como o programa gratuito Statistics101. Você pode inserir seus resultados observados e dizer-lhe para gerar, digamos, 100.000 conjuntos de dados reamostrados, calcular e salvar a média ea mediana de cada um, e, em seguida, calcular o SD eo 2.5th e percentis 97,5 desses 100.000 meios e 100.000 medianas. Aqui estão alguns resultados de uma análise de bootstrap realizada nesta data:
dados reais: 61, 88, 89, 89, 90, 92, 93, 94, 98, 98, 101, 102, 105, 108, 109, 113, 114, 115, 120, e 138. Média = 100.85- Média = 99,5
Resampled conjunto de dados #1: 61, 88, 88, 89, 89, 90, 92, 93, 98, 102, 105, 105, 105, 109, 109, 109, 109, 114, 114, e 120. Média1 = 99,45, Median1 = 103,50
Resampled conjunto de dados #2: 61, 88, 89, 89, 90, 92, 92, 98, 98, 98, 102, 105, 105, 108, 108, 113, 113, 113, 114, e 138. Média2 = 100,7, Median2 = 100,0
(Entre Set # 2 e o seguinte conjunto, 99,996 conjuntos de dados mais bootstrapped foram gerados.)
Resampled conjunto de dados #99,999: 61, 61, 88, 89, 92, 93, 93, 94, 98, 98, 98, 101, 102, 105, 109, 114, 115, 120, 120 e 138. Média99.999 = 99,45, Median99.999 = 98.00
Resampled conjunto de dados #100,000: 61, 61, 61, 88, 89, 89, 90, 93, 93, 94, 102, 105, 108, 109, 109, 114, 115, 115, 120 e 138. Média100.000 = 97,7, mediana100.000 = 98,0
Aqui está um resumo dos 100.000 resamples:
O SD do 100.000 significars = 3.46- este é o bootstrap SE da média (MEV).
O SD do 100.000 medianas = 4.24- este é o bootstrap SE da mediana.
Os 2.5th e 97,5 percentis da 100000 significa = 94,0 107.6- e estes são os limites de confiança de 95% para o bootstrap significar.
Os 2.5th e 97,5 percentis da 100000 medianas = 92,5 108.5- e estes são os limites de confiança de 95% para o bootstrap mediana.
Então você iria relatar a sua média e mediana, juntamente com os seus bootstrapped erros padrão e 95% de intervalo de confiança desta forma:
Média = 100.85 # 177- 3,46 (94.0-107.6) - Média = 99,5 # 177- 4,24 (92.5-108.5).
Você notará que a SE é maior (e do CI é mais largo) para a mediana do que para a média. Isso geralmente é verdade para dados distribuídos normalmente - a mediana tem cerca de 25% maior variabilidade do que a média. Mas, para dados não-normalmente distribuídos, a mediana é muitas vezes mais preciso do que a média.
Você não precisa usar bootstrapping para algo tão simples como a SE ou CI de uma média porque há fórmulas simples para isso. Mas o método bootstrap pode facilmente calcular a SE ou CI por uma média, um coeficiente de correlação, ou um parâmetro farmacocinético como a AUC ou eliminação meia-vida de uma droga, para a qual não há simples fórmulas e para os quais SE ou CI os pressupostos de normalidade pode não se aplicar.
Bootstrapping é conceitualmente simples, mas não é infalível. O método envolve certas suposições e tem certas limitações. Por exemplo, ele provavelmente não vai ser muito útil se você tem apenas alguns valores observados. Confira estatísticas 101 Para obter mais informações sobre como utilizar o método de inicialização (e para o software Statistics101 livre para fazer os cálculos de bootstrap muito facilmente).