Bases de dados do gráfico em um ambiente de dados Big

A estrutura fundamental para bancos de dados do gráfico em grande de dados é chamado # 147-node-relacionamento. # 148- Esta estrutura é mais útil quando você tem que lidar com dados altamente interligados. suporte nós e relacionamentos Propriedades, um par de valores-chave, onde os dados são armazenados.

Estas bases de dados são navegados, seguindo as relações. Este tipo de armazenamento e de navegação não é possível em RDBMSs (sistemas de gerenciamento de banco de dados relacional), devido às estruturas de tabela rígidas e a incapacidade de seguir as conexões entre os dados onde quer que poderia nos levar. Um banco de dados do gráfico pode ser usado para gerenciar dados geográficos para exploração de petróleo ou para modelar e optimizar as redes de um provedor de telecomunicações.

Uma das bases de dados de gráficos mais amplamente utilizado é Neo4J. É um projeto open source licenciado sob a licença pública GNU v3.0. A, versão comercial suportado é fornecido por Neo Tecnologia sob a GNU AGPL v3.0 e licenciamento comercial.

Neo4J é um banco de dados de transações ACID oferecendo alta disponibilidade através de clustering. É um banco de dados confiável e escalável que é fácil de modelar por causa da estrutura fundamental as propriedades de nó-de relacionamento 'e como, naturalmente, ele mapeia para nossas próprias relações humanas. Não requer um esquema, nem requer de tipos de dados, por isso é inerentemente muito flexível.

Com essa flexibilidade vem algumas limitações. Nós não pode referenciar-se diretamente. Por exemplo, você (como um nó) não pode ser também seu próprio pai ou a mãe (como as relações), mas você pode ter uma pai ou a mãe. Pode haver casos reais em que é necessária a auto-referência.

Se assim for, um banco de dados gráfico não é a melhor solução uma vez que as regras sobre a auto-referência são rigorosamente aplicadas. Enquanto a capacidade de replicação é muito bom, Neo4J só pode replicar gráficos inteiras, colocando um limite para o tamanho total do gráfico (cerca de 34 bilhões de nós e 34 bilhões de relacionamentos).

Características importantes do Neo4J incluem o seguinte:

  • Integração com outras bases de dados: Neo4J suporta gerenciamento de transações com rollback para permitir a interoperabilidade perfeita com não gráfica armazenamentos de dados.

  • serviços de sincronização: Neo4J suporta comportamentos orientados a eventos através de um barramento de evento, sincronização periódica utilizando-se, ou um RDBMS como o mestre, e sincronização lote tradicional.

  • Resiliência: Neo4J suporta frios (isto é, quando banco de dados não está sendo executado) e quente (quando ele está sendo executado) backups, bem como um modo de armazenamento em cluster de alta disponibilidade. alertas padrão estão disponíveis para integração com sistemas de gestão das operações existentes.

  • linguagem de consulta: Neo4J suporta uma linguagem declarativa chamado Cypher, projetado especificamente para consultar gráficos e seus componentes. comandos Cypher são vagamente baseado em sintaxe SQL e destinam-se a consultas ad hoc dos dados do gráfico.

implementações Neo4j são mais adequados para

  • Rede social

  • A classificação de domínios biológicos ou médicos

  • Criação de comunidades dinâmicas de prática ou interesse

menu