Previsão técnicas na análise estatística de Big Data

Muitas técnicas diferentes foram desenvolvidos para prever o valor futuro de uma variável. Duas delas são modelos de regressão de séries temporais e modelos de simulação.

modelos de regressão de séries temporais

UMA modelo de regressão de séries temporais é usada para estimar a tendência seguido por uma variável ao longo do tempo, utilizando técnicas de regressão. UMA linha de tendência mostra a direção em que uma variável está se movendo no decorrer do tempo.

Como exemplo, a figura mostra uma série temporal que representa a produção anual de uma mina de ouro (medido em milhares de onças por ano) desde a mina aberta há dez anos.

Uma série temporal mostrando produção de ouro por ano durante os últimos dez anos.
Uma série temporal mostrando produção de ouro por ano durante os últimos dez anos.

A equação da linha de tendência é estimada como sendo

Y = 0,9212x + 1,3333

Onde

x é o ano.
Y é a produção anual de ouro (medido em milhares de onças).

Esta linha de tendência é estimada usando análise de regressão. A linha de tendência mostra que, em média, a saída da mina cresce 0.9212 mil (921,2 onças) a cada ano.

Você pode usar esta linha de tendência para prever a saída do próximo ano (o 11º ano de operação), substituindo 11 para X, do seguinte modo:

Y = 0,9212x + 1,3333
Y = 0,9212 (11) + 1,3333 = 11,4665

Com base na equação de linha de tendência, seria esperado que a mina para produzir 11,466.5 onças de ouro no próximo ano.

Os modelos de simulação

Você pode usar simulação modelos para prever uma série de tempo. Os modelos de simulação são extremamente flexíveis, mas pode ser extremamente demorado para implementar. Sua precisão também depende de suposições feitas sobre as propriedades estatísticas dos dados de séries temporais.

Duas abordagens padrão para previsão de séries financeiras com modelos de simulação são simulação histórica e simulação Monte Carlo.

simulação histórica

Histórico simulação é uma técnica utilizada para gerar uma distribuição de probabilidade para uma variável à medida que evolui ao longo do tempo, com base nos seus valores passados. Se as propriedades da variável a ser simulada permanecer estável ao longo do tempo, esta técnica pode ser altamente precisos. Uma desvantagem dessa abordagem é que, a fim de obter uma previsão precisa, você precisa ter uma grande quantidade de dados. Depende também do pressuposto de que o comportamento passado de uma variável irá continuar no futuro.

Como exemplo, esta figura mostra um histograma que representa os retornos de um estoque ao longo dos últimos 100 dias.

Um histograma dos retornos das ações.
Um histograma dos retornos das ações.

Este histograma mostra a distribuição de probabilidade de retornos sobre o estoque com base nos últimos 100 dias de negociação. O gráfico mostra que o retorno mais frequente nos últimos 100 dias foi uma perda de 2 por cento, a segunda mais frequente foi uma perda de 3 por cento, e assim por diante. Você pode usar as informações contidas neste gráfico para criar uma distribuição de probabilidade para o retorno mais provável desta unidade ao longo do dia de negociação seguinte.

Simulação de Monte Carlo

Monte Carlo simulação é uma técnica na qual números aleatórios são substituídos em um modelo estatístico para prever os valores futuros de uma variável. Esta metodologia é utilizada em muitas disciplinas diferentes, incluindo finanças, economia e as ciências duras, como a física. Simulação de Monte Carlo pode funcionar muito bem, mas também pode ser extremamente demorado para implementar. Além disso, a sua exactidão depende do modelo estatístico a ser utilizado para descrever o comportamento das séries temporais.

menu