Como Contorno Teste e Teste de dados para análise preditiva
Quando seus dados está pronto e você está prestes a começar a construir seu modelo preditivo para análise, é útil para delinear a sua metodologia de teste e elaborar um plano de teste. O teste deve ser impulsionado pelas metas de negócios que você recolheu, documentados, e recolhidos todos os dados necessários para ajudá-lo a alcançar.
Direita fora do bastão, você deve desenvolver um método para testar se uma meta de negócios foi alcançado com sucesso. Desde a análise preditiva medir a probabilidade de um resultado futuro - e a única maneira de estar pronto para executar um tal teste é através da formação de seu modelo em dados passados, você ainda tem que ver o que ele pode fazer quando está acima de encontro a dados futuros.
Claro, você não pode arriscar a execução de um modelo inédito em dados futuros reais, então você vai precisar usar os dados existentes para simular dados futuras de forma realista. Para fazer isso, você tem que dividir os dados que você está trabalhando em treinamento e teste conjuntos de dados.
Tenha certeza que você selecione esses dois conjuntos de dados de forma aleatória, e que ambos os conjuntos de dados conter e cobrir todos os parâmetros de dados que você está medindo.
Quando você dividir os dados em conjuntos de dados de teste e de treinamento, você está evitando eficazmente quaisquer problemas sobreajustamento que podem surgir com overtraining o modelo em todo o conjunto de dados e pegar todos os padrões de ruído ou características específicas que só pertencem ao conjunto de dados de exemplo e não são aplicáveis a outros conjuntos de dados.
Separando os dados para treinamento e teste conjuntos de dados, cerca de 70 por cento e 30 por cento, respectivamente, garante uma medição precisa do desempenho do modelo de análise preditiva que você está construindo. Que pretende avaliar o seu modelo contra os dados de teste, porque é uma maneira simples de medir se as previsões do modelo são precisas.