Análise de clientes e de formação e períodos de validação

Uma abordagem sofisticada e muitas vezes essencial para a análise de séries temporais envolve particionar seus dados de clientes em períodos de treinamento e validação. No período de treinamento, você construir uma equação de regressão sobre a primeira seção de dados de (cerca de dois terços a três quartos dos seus dados).

Você, então, aplicar a equação de regressão para a parte posterior de seus dados no período de validação para ver quão bem os dados anteriores, na verdade, prevê os dados posteriores.

Com os dados de assinante, você poderia usar os primeiros 20 meses (janeiro 2012 a agosto de 2013) como o período de formação e setembro 2013 a fevereiro de 2014 como o período de validação. Esta abordagem é testar a equação usando os dados que você já tem, que é o mais perto que você pode começar a testar o quão bem uma previsão pode executar quando novos dados vem em.

A equação de regressão para os primeiros 20 meses é:

Inscritos = 2033.9e0,0269x

a r# 178- = 0,9979, o que mostra um bom ajuste para a linha exponencial. Você pode então usar esta equação de regressão para ver o quão bem ele prediz os últimos seis meses do conjunto de dados. Os últimos seis meses são 21 a 26. A figura mostra os valores previstos e reais para agosto 2013 a fevereiro de 2014, classificou o Validation (na coluna Período).

image0.jpg

Para avaliar o quão bem essa previsão realmente é, duas colunas adicionais foram criados. O primeiro é o erro em bruto a partir do número real com a previsão. Por exemplo, em setembro de 2013, a previsão era curto por 5 assinantes. Em fevereiro de 2014, ele foi curto por 28. Este tipo de erro crua pode-se ser compreensível, se você estiver familiarizado com os dados do cliente que você está trabalhando.

Ao comunicar o quanto de erro seus valores previstos têm, muitas vezes é mais fácil de falar em termos de porcentagem de erro.

O erro percentual médio absoluto (MAPE) pode ser um pouco mais compreensível para as partes interessadas. É calculado por encontrar o valor absoluto da diferença entre os valores previstos e reais, depois dividindo essa diferença pelo valor actual para calcular a percentagem de erro absoluto. Este é então calculada a média para cada valor.

image1.jpg

A coluna APE mostra o erro percentual absoluto. Por exemplo, para Janeiro de 2013, a equação de regressão previu 2.885 subscribers- o número real de assinantes foi de 2.844, ou seja, a equação superestimou por 41 assinantes.

Aplicando a fórmula do Excel para o erro percentual absoluto (APE) gera um erro de 1,4%:

= ABS (2885-2844) / 2885 = 0,014 ou 1,4%

A MAPE para o período de treinamento é 0,589%. A MAPE para o período de validação é 0,870%, o que é um pouco maior, mas ambos ainda estão abaixo de 1%.

Finalmente, as previsões para março, abril e maio 2014 são 4.205, 4.320 e 4.437.

= Exp (0,0269 * 27) * = 2033,9 4205
= Exp (0,0269 * 28) * = 2033,9 4320
= Exp (0,0269 * 29) * = 2033,9 4437

Há uma série de técnicas mais sofisticadas que podem fazer modelos mais precisas, tendo em conta a sazonalidade e autocorrelação, e em seguida alisar os dados para melhor interpretar os padrões. Software como o JMP e Minitab têm estas características embutidas.

Prever o futuro é sempre arriscado, porque você está assumindo que o futuro terá padrões semelhantes aos do passado. Na maioria dos casos ele faz e pode ser um excelente indicador do comportamento do cliente. No entanto, os eventos incomuns (ultrajado clientes em mídias sociais, um ataque terrorista, ou recessão) que são imprevisíveis podem afetar substancialmente a precisão de suas previsões. Trate predições como um guia, não um absoluto.

menu