Explorar a Big Data Stack

Para entender big data, que ajuda a ver como ele se destaca - ou seja, colocar para fora os componentes da arquitetura. Uma arquitetura de grande gerenciamento de dados deve incluir uma variedade de serviços que permitem às empresas fazer uso de fontes de dados miríade de forma rápida e eficaz.

image0.jpg

Aqui está uma olhada no que está na imagem e a relação entre os componentes:

  • Interfaces e feeds: Em ambos os lados do diagrama são indicações de interfaces de e alimenta dentro e fora de ambos os dados gerenciados internamente e feeds de dados de fontes externas. Para entender como os dados big funciona no mundo real, começar por compreender essa necessidade.

    O que torna grande big data é que ele se baseia em pegar grandes quantidades de dados a partir de muitas fontes. Portanto, as interfaces de programação de aplicativos (APIs) abertas será fundamental para qualquer arquitetura de dados grande.

    Além disso, tenha em mente que existem interfaces de em todos os níveis e entre todas as camadas da pilha. Sem serviços de integração, big data não pode acontecer.

  • Redundante infra-estrutura física: A infra-estrutura física de apoio é fundamental para o funcionamento e escalabilidade de uma arquitetura de dados grande. Sem a disponibilidade de infra-estruturas físicas robustas, grandes dados provavelmente não teria surgido como uma tendência tão importante.

    Para suportar um volume imprevisto ou imprevisível dos dados, uma infra-estrutura física para big data tem que ser diferente do que para os dados tradicionais. A infra-estrutura física baseia-se num modelo de computação distribuída. Isto significa que os dados podem ser fisicamente armazenados em muitos locais diferentes e podem ser ligados entre si através de redes, a utilização de um sistema de arquivos distribuído, e várias grandes ferramentas analíticas de dados e aplicações.

  • infra-estrutura de segurança: A análise de big data mais importante se torna para as empresas, o mais importante será assegurar que os dados. Por exemplo, se você é uma empresa de saúde, você provavelmente vai querer usar aplicações de dados grandes para determinar mudanças na demografia ou mudanças nas necessidades dos pacientes.

    Estes dados sobre os seus constituintes precisa ser protegido tanto para atender aos requisitos de conformidade e para proteger a privacidade dos pacientes. Você terá que ter em conta quem tem permissão para ver os dados e em que circunstâncias eles estão autorizados a fazê-lo. Você precisará ser capaz de verificar a identidade dos usuários, bem como proteger a identidade dos pacientes.

  • fontes de dados operacionais: Quando você pensa sobre big data, entender que você tem que incorporar todas as fontes de dados que lhe dão uma imagem completa do seu negócio e ver como os impactos de dados a maneira de operar o seu negócio.

    Tradicionalmente, uma fonte de dados operacional consistia de dados altamente estruturados geridos pela linha de negócio em um banco de dados relacional. Mas à medida que o mundo muda, é importante compreender que os dados operacionais tem agora a abranger um conjunto mais amplo de fontes de dados.

menu