Como utilizar dados Smoothing em análise preditiva

suavização de dados

em análise preditiva é, essencialmente, tentando encontrar o # 147 sinal # 148- na # 147 ruído # 148- descartando pontos de dados que são considerados # 147 barulhenta # 148-. A ideia é aguçar os padrões nos dados e destacar as tendências dos dados está apontando.

image0.jpg

A implicação para trás alisamento dados é que os dados consiste em duas partes: uma parte (que consistem nas pontos de dados centrais) Que significa tendências gerais ou tendências reais, e uma outra parte que consiste principalmente de desvios (barulho) - Alguns pontos flutuantes que resultam de alguma volatilidade nos dados. suavização de dados visa eliminar essa segunda parte.

Como para diminuir o ruído

suavização de dados opera em várias suposições:

  • Essa flutuação de dados é mais provável de ser ruído.

  • Que a parte ruidosa dos dados é de curta duração.

  • Que a flutuação dos dados, independentemente de quão variada que seja, não afetará as tendências subjacentes representadas pelos pontos de dados centrais.

Ruído nos dados tende a ser aleatório suas flutuações não deve afetar as tendências gerais tiradas de examinar o resto dos dados. Assim, reduzindo ou eliminando pontos de dados ruidosos pode esclarecer as tendências e padrões reais nos dados - na verdade, melhorar os dados de # 147-relação sinal-ruído # 148.;

Desde que você tenha identificado o ruído corretamente e, em seguida, reduziu-a, suavização de dados pode ajudar a prever apontar os próximos dados observados simplesmente seguindo as principais tendências que você detectados nos dados.

suavização de dados se preocupa com a maioria dos pontos de dados, as suas posições em um gráfico, e quais são os padrões resultantes prever sobre a tendência geral de (digamos) um preço das ações, se a sua orientação geral é para cima, para baixo ou para os lados.

Esta técnica não irá prever com precisão o preço exato do comércio próximo para um determinado estoque - mas prevendo uma tendência geral pode produzir insights mais poderosos do que saber o preço real ou suas flutuações.

Uma previsão baseada em uma tendência geral deduzida a partir de dados suavizados assume que qualquer direção que os dados tenham seguido até agora continuará no futuro de uma forma consistente com a tendência. No mercado de ações, por exemplo, o desempenho passado não é indicação definitiva de desempenho futuro, mas certamente pode ser um guia geral para o futuro movimento do preço das ações.

Métodos, vantagens e desvantagens de suavização de dados

suavização de dados não é ser confundido com ajustamento de um modelo, que faz parte da análise de dados consiste em dois passos:

  1. Encontrar um modelo adequado que representa os dados.

  2. Certifique-se de que o modelo se ajusta aos dados de forma eficaz.

suavização de dados se concentra em estabelecer uma direção fundamental para os pontos de dados núcleo por (1) ignorando quaisquer pontos de dados barulhento e (2) desenhando uma curva suave através dos pontos de dados que ignora os queridos contorcendo e enfatiza padrões primários - tendências - nos dados, não importa como retardar seu surgimento. Por conseguinte, em uma série de tempo numérica, alisamento de dados serve como uma forma de filtragem.

Dados de alisamento pode usar qualquer um dos seguintes métodos:

  • Caminhada aleatória baseia-se na ideia de que o próximo resultado, ou ponto de dados futuro, é um desvio aleatório a partir da última conhecida, ou presente, ponto de dados.

  • média móvel é uma média de execução de períodos consecutivos, igualmente espaçados. Um exemplo seria o cálculo de uma média móvel de 200 dias de um preço das ações.

  • suavização exponencial atribui exponencialmente mais peso ou importância, a pontos de dados recentes do que para pontos de dados mais antigos.

  • Simples: Este método deve ser usado quando os dados de séries temporais não tem tendência e sem sazonalidade.

  • Linear: Este método deve ser usado quando os dados de séries temporais tem uma linha de tendência.

  • Sazonal: Este método deve ser usado quando os dados de séries temporais não tem nenhuma tendência, mas sazonalidade.

O que esses métodos de nivelamento todos têm em comum é que eles realizam algum tipo de processo média em vários pontos de dados. Essa média de pontos de dados adjacentes é a maneira essencial para zero em tendências ou padrões subjacentes.

As vantagens de alisamento são dados

  • É fácil de implementar.

  • Ela ajuda a identificar tendências.

  • Isso ajuda a expor padrões nos dados.

  • Ele elimina pontos de dados que você decidiu não são de interesse.

  • Ele ajuda a prever a direção geral dos próximos pontos de dados observados.

  • Ele gera gráficos bons lisas.

Mas tudo tem um lado negativo. As desvantagens de suavização de dados são

  • Pode eliminar pontos de dados válidos que resultam de eventos extremos.

  • Ela pode levar a previsões imprecisas, se os dados de teste só é sazonal e não plenamente representativo da realidade que gerou os pontos de dados.

  • Ele pode mudar ou distorcer os dados, especialmente os picos, resultando em uma imagem distorcida do que está acontecendo.

  • Ele pode estar vulnerável a perturbações significativas de valores atípicos dentro dos dados.

  • Pode resultar num grande desvio a partir dos dados originais.

Se a suavização de dados não faz mais do que dar os dados de um mero facelift, pode desenhar uma fundamentalmente errado nas seguintes maneiras:

  • Pode introduzir erros através de distorções que tratam os dados suavizados como se eram idênticos aos dados originais.

  • Ele pode distorcer a interpretação por ignorar - e se escondendo - os riscos embutidos nos dados.

  • Ela pode levar a uma perda de detalhes dentro de sua dados - que é uma maneira que uma curva suavizada pode desviar-se muito de que dos dados originais.

Como a sério suavização de dados pode afetar seus dados depende da natureza dos dados em mãos, e que a suavização técnica foi implementada nesses dados. Por exemplo, se os dados original tem mais picos em que, em seguida, os dados de alisamento conduzirá a um grande deslocamento desses picos nos gráficos suavizadas - provavelmente uma distorção.

Aqui estão alguns pontos de advertência para manter em mente quando você se aproxima de suavização de dados:

  • É uma boa idéia para comparar gráficos suavizada para gráficos intocadas que plotar os dados originais.

  • Os pontos de dados removidos durante a suavização de dados podem não ser ruídos poderiam ser válidos, os pontos de dados reais que são resultado dos eventos raros-mas-real.

  • suavização de dados podem ser úteis na moderação, mas seu uso excessivo pode levar a uma deturpação de seus dados.

Ao aplicar o seu julgamento profissional e sua perícia conhecimento do negócio, você pode usar dados suavização de forma eficaz. Remoção de ruído das seus dados - sem afetar negativamente a precisão ea utilidade dos dados originais - é pelo menos tanto uma arte quanto uma ciência.

menu