Fase 1 do modelo de processo CRISP-DM: entendimento do negócio

o Cross-Industry processo padrão de Data Mining

(CRISP-DM) É a estrutura de processo dominante para a mineração de dados. Na primeira fase de um projeto de mineração de dados, antes de se aproximar de dados ou ferramentas, você define o que você está fora de realizar e definir as razões para querer atingir esse objetivo.

A fase de entendimento do negócio inclui quatro tarefas (Actividades primárias, cada um dos quais pode envolver várias partes menores).

Tarefa: Identificar seus objetivos de negócio

A primeira coisa que você deve fazer em qualquer projeto é descobrir exatamente o que você está tentando realizar! Isso é menos óbvia do que parece. Muitos mineiros de dados têm investido tempo na análise de dados, apenas para descobrir que sua gestão não foi particularmente interessados ​​na questão que está investigando. Você deve começar com uma compreensão clara de

  • Um problema que a sua gestão quer endereçar

  • Os objetivos de negócio

  • As restrições (limitações sobre o que você pode fazer, os tipos de soluções que podem ser usados, quando o trabalho deve ser concluído, e assim por diante)

  • De impacto (como o problema e as possíveis soluções encaixar com o negócio)

Entregas para esta tarefa incluem três itens (geralmente breves relatórios enfocando apenas os pontos principais):

  • Fundo: Explicar a situação de negócio que conduz o projeto. Este item, como muitos que se seguem, ser de apenas alguns parágrafos.

  • objetivos de negócio: Definir o que sua organização pretende realizar com o projeto. Isso geralmente é um objetivo mais amplo do que você, como um mineiro de dados, pode realizar de forma independente. Por exemplo, o objetivo de negócio poderia ser a de aumentar as vendas de uma campanha publicitária de férias em 10 por cento ano a ano.

  • critérios de sucesso do negócio: Definir como os resultados serão medidos. Tentar obter critérios de sucesso quantitativos claramente definidos. Se você deve usar critérios subjetivos (dica: termos como ter uma visão ou obter uma alça sobre implica critérios subjetivos), pelo menos, obter um acordo sobre exatamente quem vai julgar ou não esses critérios foram cumpridos.

Tarefa: Avaliando sua situação

Isto é onde você entrar em mais detalhes sobre os problemas associados com os seus objetivos de negócio. Agora você vai aprofundar averiguação, construindo uma explicação muito mais carnudas das questões delineadas na tarefa objetivos de negócio.

Entregas para esta tarefa incluem cinco relatórios detalhados:

  • Inventário dos recursos: Uma lista de todos os recursos disponíveis para o projeto. Estes podem incluir pessoas (mineiros não apenas dados, mas também aqueles com conhecimento especializado do problema de negócio, gerentes de dados, suporte técnico e outros), dados, hardware e software.

  • Requisitos, premissas e restrições: Requisitos incluirá um calendário para a conclusão, obrigações legais e de segurança e os requisitos para o trabalho acabado aceitável. Este é o ponto para verificar que você terá acesso a dados apropriados!

  • Riscos e contingências: Identificar as causas que poderiam atrasar a conclusão do projeto, e preparar um plano de contingência para cada um deles. Por exemplo, se uma interrupção de Internet em seu escritório poderia representar um problema, talvez o seu contingência poderia ser para trabalhar em outro cargo até a interrupção acabou.

  • Terminologia: Criar uma lista de termos de negócios e termos de mineração de dados que são relevantes para o seu projecto e anotá-las em um glossário com definições (e talvez exemplos), de modo que todos os envolvidos no projeto pode ter uma compreensão comum desses termos.

  • Custos e benefícios: Prepare uma análise custo-benefício para o projeto. Tente declarar todos os custos e benefícios em dólar (euro, libra, iene, e assim por diante) termos. Se os benefícios não excedem significativamente os custos, parar e reconsiderar esta análise e seu projeto.

Os tomadores de decisão muitas vezes se sentem recursos atribuindo mais confortáveis ​​para projectos de redução de custos do que as que se destinam a aumentar a receita, por isso sempre olhar para o potencial de redução de custos e oportunidades de poupança do Estado pela primeira vez em sua custos e benefícios relatório.

Tarefa: Definir suas metas de mineração de dados

Alcançar a meta de negócios exige muitas vezes a ação de muitas pessoas, não apenas o minerador de dados. Então, agora, você deve definir a sua pequena parte dentro do quadro maior. Se o objetivo do negócio é reduzir o atrito do cliente, por exemplo, suas metas de mineração de dados pode ser identificar as taxas de desgaste por vários segmentos de clientes, e desenvolver modelos para prever quais clientes estão em maior risco.

Entregas para esta tarefa incluem dois relatórios:

  • metas de mineração de dados: Definir resultados de mineração de dados, tais como modelos, relatórios, apresentações, e conjuntos de dados processados.

  • critérios de sucesso de mineração de dados: Definir os critérios técnicos de mineração de dados necessários para suportar os critérios de sucesso empresarial. Tentar defini-los em termos quantitativos (tais como a precisão do modelo ou a melhoria preditivo em relação a um método existente). Se os critérios devem ser qualitativa, identificar a pessoa que faz a avaliação.

Tarefa: Produzindo seu plano de projeto

Agora você especificar cada passo que você, o mineiro dos dados, pretende levar até que o projeto seja concluído e os resultados são apresentados e analisados.

Entregas para esta tarefa incluem dois relatórios:

  • Plano de projeto: Delinear o seu plano de acção passo-a-passo para o projeto. Expandir o contorno com um calendário para a conclusão de cada etapa, os recursos necessários, insumos (tais como dados ou uma reunião com um especialista no assunto), e saídas (tais como dados limpos, um modelo, ou um relatório) para cada passo, e dependências (etapas que não pode começar até que essa etapa for concluída). Explicitamente que certos passos devem ser repetidos (por exemplo, modelagem e avaliação costumam chamar de várias repetições de vai-e-vem).

  • A avaliação inicial de ferramentas e técnicas: Identificar os recursos necessários para cumprir suas metas de mineração de dados e avaliar as ferramentas e recursos que você tem. Se algo está faltando, você tem que abordar essa preocupação logo no início do processo.

menu