Mesclando e Dados Appending

Quando seus dados estão em mais de um lugar, você precisa de maneiras de colocar tudo isso junto. Quando você juntar dois conjuntos de dados com diferentes variáveis, você está fusão dados. A fusão é uma operação comum. A fusão é frequentemente utilizada na mineração de dados, combinando dados vinculados, como

  • registros de clientes e dados de campanhas de marketing

  • Antes e depois os resultados do teste

  • dados internos e fornecedor

Para mesclar conjuntos de dados, você deve ter uma variável que identifica casos de matching- isso é chamado de chave ou identificador variável. E você pode ter que identificar um dos conjuntos de dados como primário- tabela primária deve ter apenas um caso para qualquer valor da variável chave.

Algumas aplicações de mineração de dados tem mais do que um instrumento de fusão das bases de dados: A primeira figura mostra a ferramenta para fusões básicos, ea segunda figura mostra a ferramenta para a criação de critérios de mesclagem mais complexos.

image0.jpgimage1.jpg

Se as fontes de dados contêm as mesmas variáveis ​​(mais ou menos- a partida não tem de ser idênticos), mas casos diferentes, se juntando a eles é chamado anexando ou concatenação. Como fusão, esta é uma operação comum. É usado sempre que você tem casos novos para algo que você já tenha sido de rastreamento.

image2.jpg

A parte complicada de encontrar a ferramenta certa é muitas vezes descobrir o que é chamado. Olhe nos menus (ou procure) para anexar, concatenar, ou mesclar linhas.

menu