Como tratar de problemas na análise preditiva

modelagem preditiva está ganhando popularidade como uma ferramenta para o gerenciamento de muitos aspectos do negócio. Assegurar que a análise dos dados é feito para a direita irá aumentar a confiança nos modelos utilizados - o que, por sua vez, pode gerar o buy-in necessário para a análise preditiva para se tornar parte do conjunto de ferramentas padrão da sua organização.

Talvez este aumento da popularidade vem das maneiras em que um projeto de análise preditiva pode apoiar a tomada de decisão através da criação de modelos que descrevem conjuntos de dados, descobrir possíveis novos padrões e tendências (como indicado pelos dados), e prever resultados com maior confiabilidade.

Para alcançar este objetivo, um projeto de análise preditiva deve entregar um modelo que melhor se ajusta aos dados, selecionando as variáveis ​​de decisão correcta e eficiente. Algumas questões vitais devem ser respondidas em rota para esse objetivo:

  • Quais são os pressupostos mínimos e variáveis ​​de decisão que permitem o modelo para melhor atender os dados?

  • Como o modelo em construção comparar com outros modelos aplicáveis?

  • Que critérios são os melhores para avaliar e pontuar este modelo?

Mais uma vez, você pode chamar a voz da experiência para o resgate: especialistas conhecimento de domínio pode discutir estas questões, interpretar quaisquer resultados que mostram padrões ocultos nos dados, e ajudar a verificar e validar o resultado do modelo.

Como para descrever as limitações do modelo de análise preditiva

Qualquer modelo analítico preditivo tem certas limitações com base nos algoritmos que emprega e o conjunto de dados que é executado. Você deve estar ciente dessas limitações e fazê-los trabalhar a seu advantage- as relacionadas com os algoritmos incluem

  • Se os dados têm padrões não-lineares (não forma uma linha)

  • Como altamente correlacionadas as variáveis ​​são (relações estatísticas entre os recursos)

  • Se as variáveis ​​são independentes (não há relações entre recursos)

  • Se o âmbito da amostra de dados faz com que o modelo propenso a superajuste

Para superar as limitações do seu modelo, som uso validação cruzada técnicas para testar seus modelos. Comece por dividir seus dados em treinamento e teste conjuntos de dados e executar o modelo para cada uma dessas bases de dados separadamente para avaliar e marcar as previsões do modelo.

Como testar e avaliar o seu modelo de análise preditiva

Nenhum modelo pode produzir 100 por cento preciso forecasts- qualquer modelo tem o potencial para produzir resultados imprecisos. Seja à procura de qualquer variação significativa entre as previsões do modelo produz e os dados observados - especialmente se as saídas do modelo contradiz o senso comum. Se isso parece muito bom, mau, ou extrema para ser verdade, então provavelmente não é verdade (para a realidade, de qualquer maneira).

No processo de avaliação, examinar cuidadosamente as saídas dos modelos que você está testando e compará-los com as variáveis ​​de entrada. capacidade de previsão do seu modelo deve responder a todas as metas comerciais estabelecidas que levaram a sua criação em primeiro lugar.

Se erros ou preconceitos surgem na produção de seu modelo, tentar rastreá-los de volta para

  • A validade, a confiabilidade ea sazonalidade relativa dos dados

  • Premissas utilizadas no modelo

  • As variáveis ​​que foram incluídos ou excluídos na análise

Trabalhar com os usuários de negócios para avaliar cada etapa do processamento do seu modelo de certificar-se de que os resultados do modelo podem ser facilmente interpretados e utilizados em uma situação de negócios do mundo real. Equilibrar a precisão e confiabilidade do modelo com a facilidade com que as saídas do modelo podem ser interpretados e aplicados de forma prática.

Como evitar os modelos de análise preditiva não escaláveis

Quando você está construindo um modelo, sempre manter a escalabilidade em mente. Sempre verifique o desempenho, precisão e confiabilidade do modelo em várias escalas. Seu modelo deve ser capaz de mudar sua escala - e ampliar tão grande quanto necessário - sem caindo aos pedaços ou saída previsões ruins.

Escalabilidade foi um grande desafio no passado. modelos preditivos levou muito tempo para construir e para executar. Os conjuntos de dados os modelos eram executados em eram pequenos, e os dados era caro para recolher, armazenar e pesquisa. Mas isso era tudo na # 147 pré-big data # 148- era.

Hoje big data é barato, abundante, e em crescimento. Na verdade, um outro problema potencial teares: O volume de dados formidável atualmente disponível pode afetar negativamente o modelo e degradar o seu desempenho, desatualização do modelo em um período relativamente curto de tempo. Adequadamente implementado, escalabilidade pode ajudar # 147-prova de futuro # 148- seu modelo.

O futuro não é a única ameaça. Mesmo na era atual on-line, fluxo de dados pode sobrecarregar um modelo - especialmente se os fluxos de aumento de dados a uma inundação.

volume de dados por si só pode provocar as variáveis ​​de decisão e factores que predizem a crescer para números gigantes que exigem a actualização contínua para o modelo. Então, sim, o seu modelo melhor que seja escalável - rapidamente escalável.

menu