Como escolher um algoritmo para um Modelo de Análise Preditiva
Vários de mineração de dados e de aprendizagem de máquina algoritmos estatísticos, estão disponíveis para uso em seu modelo de análise preditiva. Você está em uma posição melhor para selecionar um algoritmo depois de você ter definido os objectivos do seu modelo e selecionados os dados que você vai trabalhar.
Alguns desses algoritmos foram desenvolvidos para resolver problemas de negócios específicos, melhorar os algoritmos existentes, ou fornecer novas capacidades - o que pode tornar alguns deles mais adequado para seus propósitos do que outros. Você pode escolher entre uma variedade de algoritmos para tratar de questões de negócios, tais como as seguintes:
Para segmentação de clientes e / ou detecção de comunidades na esfera social, por exemplo, você precisa de algoritmos de agrupamento.
Para a retenção do cliente ou para desenvolver um sistema de recomendação, você pode usar algoritmos de classificação.
Para a pontuação de crédito ou prever o próximo resultado de eventos conduzidos em tempo, você pode usar um algoritmo de regressão.
Conforme o tempo e os recursos permitirem, você deve executar o maior número de algoritmos do tipo adequado como você pode. Comparando diferentes execuções de diferentes algoritmos pode trazer resultados surpreendentes sobre os dados ou a inteligência de negócios incorporado nos dados. Se o fizer, dá-lhe uma visão mais detalhada sobre o problema de negócio, e ajuda a identificar quais as variáveis dentro de seus dados têm poder preditivo.
Alguns projetos de análise preditiva ter sucesso melhor através da construção de um modelo de conjunto, um grupo de modelos que operam sobre os mesmos dados. Um modelo de conjunto usa um mecanismo pré-definido para reunir os resultados de todos os seus modelos de componentes e fornecer um resultado final para o usuário.
Os modelos podem assumir várias formas - uma consulta, um conjunto de cenários, uma árvore de decisão, ou uma análise matemática avançada. Além disso, certos modelos funcionam melhor para determinados dados e análises. Você pode (por exemplo) usam algoritmos de classificação que empregam regras de decisão para decidir o resultado de um determinado cenário ou transação, abordando questões como estas:
este cliente é susceptível de responder a nossa campanha de marketing?
É este o dinheiro de transferência provável que seja parte de um esquema de lavagem de dinheiro?
É este o requerente empréstimo provável padrão sobre o empréstimo?
Você pode usar algoritmos de agrupamento sem supervisão para encontrar o que relações existem dentro do seu conjunto de dados. Você pode usar esses algoritmos para encontrar diferentes agrupamentos entre os seus clientes, determinar quais serviços podem ser agrupados, ou decidir, por exemplo, quais os produtos que podem ser upsold.
algoritmos de regressão pode ser usado para prever os dados contínuos, tais como prever a tendência para um movimento de estoque dado os seus preços passados.
Dados e negócios objetivos não são os únicos fatores a considerar quando você está selecionando um algoritmo. A experiência de seus cientistas de dados é de grande valor neste ponto- escolher um algoritmo que vai começar o trabalho feito é muitas vezes uma combinação complicada de ciência e arte.
A parte da arte vem da experiência e proficiência no domínio do negócio, que também desempenha um papel crítico na identificação de um modelo que pode servir objetivos de negócios com precisão.