minerador de dados pioneiros Thomas Khabaza desenvolveu seus "Nove Leis de Data Mining" para orientar novos mineiros dados à medida que começar a trabalhar. Este guia de referência mostra o que cada uma dessas leis significa para o seu trabalho diário.
1ª Lei de Mineração de Dados, ou "Objectivos de visita da lei": Os objetivos de negócio são a origem de cada solução de mineração de dados.
Um mineiro de dados é alguém que descobre informações úteis a partir de dados para apoiar os objetivos de negócio específicos. A mineração de dados não é definida por a ferramenta que você usa.
2ª Lei de Mineração de Dados, ou "Lei Conhecimento do Negócio": Conhecimento do negócio é central para cada passo do processo de mineração de dados.
Você não tem de ser um estatístico fantasia para fazer a mineração de dados, mas você tem que saber algo sobre o significado dos dados e como o negócio funciona.
3ª lei de Data Mining ou "Lei Preparação de dados": preparação de dados é mais do que a metade de cada processo de mineração de dados.
Praticamente todos os minerador de dados vai gastar mais tempo na preparação dos dados que na análise.
4 Lei de Mineração de Dados, ou "Nenhum almoço livre para o mineiro de dados": O modelo certo para uma determinada aplicação só pode ser descoberto pela experiência.
Na mineração de dados, modelos são selecionados através de tentativa e erro.
Lei 5 de Data Mining: Há sempre padrões nos dados.
Como um mineiro de dados, você explorar os dados em busca de padrões úteis. Compreender os padrões nos dados permite influenciar o que acontece no futuro.
6ª Lei de Mineração de Dados, ou "Lei Insight": A mineração de dados amplifica a percepção no domínio do negócio.
métodos de mineração de dados permitem que você compreender o seu negócio melhor do que você poderia ter feito sem eles.
Lei 7 de Data Mining ou "Lei Prediction": Predição informações aumenta localmente por generalização.
A mineração de dados nos ajuda a usar o que sabemos fazer melhores previsões (ou estimativas) de coisas que não sabemos.
Lei 8 de Data Mining, ou "Lei Value": O valor dos resultados de mineração de dados não é determinada pela precisão ou a estabilidade de modelos preditivos.
Seu modelo deve produzir boas previsões, de forma consistente. É isso aí.
9ª Lei de Mineração de Dados, ou "Lei de Mudança": Todos os padrões estão sujeitos a alterações.
Qualquer modelo que lhe dá grandes previsões hoje pode ser amanhã inútil.
o Cross-Industry processo padrão de Data Mining (CRISP-DM) É a estrutura dominante processo de mineração de dados. É uma qualquer normalização aberto pode usá-lo. A lista a seguir descreve as várias fases do processo.
Identificando seus objetivos de negócio
Avaliando sua situação
Definindo suas metas de mineração de dados
Produzir seu plano de projeto
a compreensão de dados: Reveja os dados que você tem, documentá-lo, identificar gerenciamento de dados e questões de qualidade de dados. Tarefas para esta fase incluem:
Juntando informação
descrevendo
explorando
Verificando a qualidade
Preparação de dados: Obter os seus dados pronto para ser usado para a modelagem. Tarefas para esta fase incluem:
A seleção de dados
dados limpeza
construindo
integrando
formatação
Modelagem: Use técnicas matemáticas para identificar padrões dentro de seus dados. Tarefas para esta fase incluem:
selecionando técnicas
testes Designing
construção de modelos
avaliação de modelos
Avaliação: Rever os padrões que você descobriu e avaliar seu potencial para uso comercial. Tarefas para esta fase incluem:
avaliação de resultados
Revendo o processo
Determinar os próximos passos
implantação: Coloque as suas descobertas para trabalhar em negócios todos os dias. Tarefas para esta fase incluem:
implantação de planejamento (seus métodos para integrar as descobertas de mineração de dados em uso)
Relatar os resultados finais
Revendo os resultados finais