Tentando A abordagem de simulação na análise estatística

software estatístico moderno faz com que seja fácil para você analisar seus dados na maioria das situações que você é provável encontrar (resumir e representar graficamente os dados, calcular intervalos de confiança, execute testes de significância comuns, fazer análise de regressão, e assim por diante). Mas, ocasionalmente, você pode executar em um problema para o qual não existe uma solução pré-programado. Derivando novas técnicas estatísticas pode envolver um pouco de matemática muito complicada, e normalmente só um estatístico teórico profissional tenta fazê-lo.

Mas há uma maneira simples, mas geral e poderoso para obter respostas para uma série de questões estatísticas, mesmo se você não é um génio da matemática. É chamado de simulação, ou o Monte-Carlo técnica.

Estatística é o estudo das flutuações aleatórias, ea maioria dos problemas estatísticos realmente vir para baixo para a questão # 147 Quais são as flutuações aleatórias fazendo? # 148- Bem, verifica-se que os computadores são muito bons em desenho números aleatórios a partir de uma variedade de distribuições. Com o software correto, você pode programar um computador para fazer flutuações aleatórias que encarnam o problema que você está tentando solve- então você pode simplesmente ver o que essas flutuações fez. Você pode, em seguida, execute novamente este processo muitas vezes e resumir o que aconteceu no longo prazo.

A abordagem de simulação pode ser usada para resolver problemas na teoria das probabilidades, determinar a significância estatística em situações comuns ou não, calcular a potência de um estudo proposto, e muito mais. Aqui está uma simples, se algo forçada, exemplo do que a simulação pode fazer:

Qual é a chance de que o produto dos QI de duas pessoas escolhidas ao acaso é maior do que 12.000?

QI são normalmente distribuídas, com uma média de 100 e um desvio padrão de 15. (E não perguntar por que alguém iria querer multiplicar dois escores de QI juntos- é ​​apenas um exemplo!)

Tão simples como esta pergunta pode soar, é um problema muito difícil de resolver exatamente, e você teria que ser um matemático especialista para mesmo tentar fazê-lo. Mas é muito fácil de obter uma resposta por simulação. Basta fazer o seguinte:

  1. Gerar dois números aleatórios de QI (normalmente distribuída, M = 100, SD = 15).

  2. Multiplicar os dois números de QI juntos.

  3. Ver se o produto é superior a 12.000.

  4. Repita os passos 1-3 um milhão de vezes e contar quantas vezes o produto excede 12.000.

  5. Dividir essa contagem por um milhão, e você tem a sua probabilidade.

Esta simulação pode ser configurado usando o programa de Estatísticas 101 livre ou mesmo Excel. Usando o software R, os cinco passos podem ser programados em uma única linha:

sum (rnorm (1000000,100,15) * rnorm (1000000,100,15)> 12000) / 1000000

Mesmo se você não está familiarizado com a sintaxe do R, provavelmente você pode pegar a deriva do que este programa está fazendo.

  • Cada # 147 rnorm # 148- função gera um milhão de pontos de QI aleatórios.

  • o # 147 - * # 148- multiplica-los juntos em pares.

  • o # 147 -> # 148- compara cada um de um milhão de produtos para 12.000.

  • o # 147 de soma # 148- função adiciona-se o número de vezes que a comparação sai verdadeiro (verdade conta como 1- falso conta como 0).

  • o # 147 - / # 148- divide a soma de um milhão.

R imprime os resultados de Número 147-one-liner # 148- programas como este sem ter que dizê-lo explicitamente. Quando uma pessoa rodamos este programa em seu computador desktop, é calculado por cerca de meio segundo e depois impresso o resultado: 0,172046. Então ele correu novamente, e ele impresso 0,172341. Essa é uma característica de métodos de simulação - eles dão resultados ligeiramente diferentes cada vez que você executá-los. E quanto mais simulações você corre, mais precisos serão os resultados. É por isso que as etapas anteriores pedir um milhão de repetições. Você não terá uma resposta exata, mas você sabe que a probabilidade é de cerca de 0,172, que é perto o suficiente.

menu