Apache Broca

Apache broca é um projeto proposto na incubadora Apache. Apache broca não é especialmente doentio, embora. Os Apache Software Foundation (ASF) tecnologias candidatos todos começam como projetos de incubadora antes de se tornar tecnologias oficiais ASF. Você pode ler sobre o Apache Incubator. Você pode ler sobre Broca.

Inspirado pela tecnologia Dremel do Google, a meta de desempenho fixada para a broca é permitir consultas SQL contra um petabyte ou mais dos dados distribuídos entre os servidores 10,000-plus. A figura ilustra a arquitetura do Apache Drill.

image0.jpg

Você pode ver que a chave para a arquitetura broca são os servidores Drillbit implantados em cada nó de dados. Note-se que cada servidor inclui um analisador de consulta, compilador, otimizador, e tempo de execução, mas não há um servidor mestre Drillbit nomeado por servidores Zookeeper, que supervisiona a execução das consultas e cuida da tarefa de reunir os conjuntos de resultados intermediários em um único conjunto de saída.

Como Dremel, Broca pode coexistir com, e complementam, MapReduce, mas MapReduce não é utilizado para cumprir as consultas, como com Apache Hive. Em vez disso, os motores de execução de chamada Brocas foram desenvolvidos por membros da comunidade Drill.

Esta comunidade tem como objetivo fornecer consultas de baixa latência para aplicações tais como painéis em tempo real de inteligência de negócios, detecção de fraudes e outros casos de uso sensíveis ao tempo. Broca suporta tipos de dados aninhados, como buffers de protocolo Avro, JSON, e Google. Esses tipos de dados aninhados permitem tabelas muito grandes desnormalizado.

A equipe de desenvolvimento da broca também está trabalhando para fornecer amplo suporte SQL, visando o cumprimento SQL2003. Finalmente, note que a equipe de broca está fornecendo apoio HBase para que os usuários serão capazes de consultar tabelas HBase com SQL.

menu