Como Ensemble Métodos para aumentar Prediction Accuracy Analytic

Como no mundo real, então com a multiplicidade de modelos analíticos preditivos: Onde há unidade, há uma força. Diversos modelos podem ser combinadas de diferentes maneiras para fazer previsões. Você pode então aplicar o modelo combinado - chamado de modelo de conjunto - na fase de aprendizagem, na fase de classificação, ou em ambas as fases.

Aqui está uma maneira de usar um modelo de conjunto:

  1. Dividir os dados de treinamento em vários conjuntos.

  2. Tem cada um dos modelos individuais que compõem as peças do processo do modelo de conjunto de dados e aprender com ele.

  3. Faça com que cada modelo de produzir seu resultado de aprendizagem a partir desses dados.

Por enquanto, tudo bem. Mas, a fim de obter o modelo conjunto para prever um futuro rótulo de classe ou categoria para novos dados e tomar uma decisão, você tem que executar os novos dados através de todas as treinados models- cada modelo prevê um rótulo de classe. Em seguida, com base na classificação colectiva ou predição, é possível gerar uma previsão geral.

Você pode gerar essa previsão geral, simplesmente implementando um mecanismo de votação que decide o resultado final. Uma técnica de votação pode usar a etiqueta que a maioria dos modelos de prever que o rótulo que o modelo de conjunto produz como seu resultado.

Suponha que você queira construir um modelo que irá prever se uma entrada de e-mail é spam. Suponha que os dados de treinamento consiste em um conjunto de e-mails em que alguns são spam e outros não são. Depois, você pode distribuir o conjunto de dados para uma série de modelos para fins de treinamento.

Em seguida, os modelos treinados processar um e-mail de entrada. Se a maioria dos modelos de classificá-lo como spam, em seguida, o modelo de conjunto dá o endereço de e-mail do rótulo final de spam.

Outra maneira de implementar um modelo de conjunto é pesar a precisão de cada modelo que você está construindo no modelo de conjunto contra a exatidão de todos os outros modelos da conjunto:

  1. Você atribui um peso específico (precisão) para cada modelo.

  2. Este peso irá variar de um conjunto de dados para o próximo e de um problema de negócios para o próximo.

  3. Depois que os modelos são treinados, você pode usar dados de teste onde você sabe a classificação de cada ponto de dados nos dados de teste.

  4. Avaliar a previsão feita por cada modelo para cada caso de teste.

  5. Aumentar o peso para os modelos que predizem corretamente e diminuir o peso para os modelos que classificaram os dados incorretamente.

menu