Melhores práticas para a Integração de Dados Big
Muitas empresas estão explorando problemas de dados grandes e chegando com algumas soluções inovadoras. Agora é o momento de prestar atenção a alguns melhores práticas, ou princípios básicos, que irá atendê-lo bem, como você começar a sua viagem de dados grande.
Na realidade, a integração big data se encaixa no processo geral de integração de dados em toda a empresa. Portanto, você não pode simplesmente deixar de lado tudo o que você aprendeu com a integração de fontes de dados tradicionais de dados. As mesmas regras aplicam-se se você está pensando sobre o gerenciamento de dados tradicional ou gerenciamento de dados grande.
Mantenha estas questões-chave no topo da sua lista de prioridades para a integração de dados grande:
Manter a qualidade dos dados em perspectiva. Sua ênfase Ondata qualidade depende da fase da sua análise de dados grande. Não espere para ser capaz de controlar a qualidade dos dados quando você faz a sua análise inicial sobre grandes volumes de dados. No entanto, quando a diminuir as suas grandes dados para identificar um subconjunto que é mais significativo para a sua organização, isto é, quando você precisa se concentrar na qualidade dos dados.
Em última análise, a qualidade dos dados torna-se importante se você quiser que os seus resultados para ser entendido contexto n com os seus dados históricos. Como sua empresa depende cada vez mais do Analytics como uma ferramenta-chave de planejamento, qualidade dos dados pode significar a diferença entre sucesso e fracasso.
Considere os requisitos de dados em tempo real. Big Data vai trazer fluxo de dados para o primeiro plano. Portanto, você terá que ter uma compreensão clara de como você integrar dados em movimento em seu ambiente para análise previsível.
Não crie novos silos de informação. Embora tanto a ênfase em torno de big data está focada em Hadoop e outras fontes não-estruturados e semi-estruturados, lembre-se que você tem que gerenciar esses dados em contexto com o negócio. Você vai, portanto, necessidade de integrar estas fontes com a sua linha de dados de negócios e seu data warehouse.