Lotes de autocorrelação: técnica gráfica de dados estatísticos
A plot autocorrelação mostra as propriedades de um tipo de dados conhecidos como uma série temporal. UMA séries temporais refere-se a observações de uma única variável ao longo de um horizonte de tempo especificado. Por exemplo, o preço diário de ações da Microsoft durante o ano de 2013 é uma série de tempo.
Dados transversais refere-se a observações de muitas variáveis em um único ponto no tempo. Por exemplo, os preços de fechamento das 30 ações contidas no Dow Jones Industrial Average em 31 de janeiro de 2014, seria considerado dados transversais.
Um lote de autocorrelação é projetado para mostrar se os elementos de uma série temporal são positivamente correlacionados, correlação negativa, ou independentes um do outro. (O prefixo auto significa "eu" - autocorrelação se refere especificamente a correlação entre os elementos de uma série de tempo).
Um gráfico de autocorrelação mostra o valor da função de autocorrelação (ACF) no eixo vertical. Ela pode variar entre -1 e 1.
O eixo horizontal de uma trama de autocorrelação mostra o tamanho do atraso entre os elementos da série temporal. Por exemplo, a autocorrelação com desfasamento 2 representa a correlação entre os elementos da série de tempo e os elementos correspondentes que foram observados dois períodos de tempo anterior.
Esta figura mostra um gráfico de autocorrelação para os preços diários de ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
No gráfico, existe uma linha vertical (um "pico") que corresponde a cada desfasamento. A altura de cada pico mostra o valor da função de autocorrelação para a retardação.
A autocorrelação com zero de desfasamento é sempre igual a 1, porque isso representa a autocorrelação entre si e cada termo. Preço e preço com lag zero, são a mesma variável.
Cada pico que se eleva acima ou desce abaixo do das linhas tracejadas é considerado estatisticamente significativa. (Capítulo 16 fala sobre isso em detalhes.) Isso significa que o pico tem um valor que é significativamente diferente de zero. Se um pico é significativamente diferente de zero, que é uma evidência de autocorrelação. Um aumento que é perto de zero é prova contra autocorrelação.
Neste exemplo, os picos são estatisticamente significativa para os GAL-se a 24. Isto significa que as cotações da Apple estão altamente correlacionados uns com os outros. Em outras palavras, quando o preço das ações da Apple sobe, ele tende a continuar crescendo. Quando o preço das ações da Apple cai, ele tende a continuar caindo. Esta figura ilustra isso.
Mesmo que os preços diários das ações da Apple estão altamente correlacionados, os retornos diários pode não ser. Você calcular os retornos diários das cotações diárias da seguinte forma:
Onde
rt = O retorno continuamente composta no tempo t
Pt = O preço no tempo t
Pt-1 = O preço no tempo t - 1 (um período anterior t)
ln = o logaritmo natural
O logaritmo natural é o logaritmo com base de e, que é aproximadamente igual a 2,71828 # 133-.
Esta figura mostra um gráfico de autocorrelação para os retornos diários para as ações da Apple a partir de 01 de janeiro de 2013 a 31 de Dezembro de 2013.
A trama autocorrelação para retornos diários para as ações da Apple mostra que a maioria dos pontos não são estatisticamente significativos. Isso indica que os retornos não estão altamente correlacionados, como mostrado aqui.
O gráfico mostra que, exceto por uma grande recessão, os retornos de ações da Apple entre 01 de janeiro de 2013 e 31 de dezembro de 2013 não mostram qualquer padrão particular - eles tendem a flutuar aleatoriamente em torno de zero. Isto significa que os rendimentos são em grande parte independentes uns dos outros.
Você pode usar um lote de autocorrelação para determinar se os elementos de uma série de tempo são aleatória (Isto é, independentes uns dos outros). Isto é importante, porque muitos testes estatísticos que envolvem séries temporais são baseadas nesta premissa.
Como você pode ver, há muitas maneiras diferentes de visualizar seus dados. Uma imagem vale por mil palavras, como diz o ditado. E ele definitivamente é válido na análise de dados. pacotes de software de estatística vêm geralmente equipados com ferramentas gráficas fáceis de usar. Tirando proveito deles, você pode rapidamente obter insights sobre seus dados que nenhuma quantidade de processamento de números poderia dar-lhe.