Famílias de coluna no Modelo de Dados HBase
Nos dados HBase colunas modelo são agrupados em famílias de colunas, que deve ser definido na frente durante a criação da tabela. famílias de coluna são armazenados em conjunto no disco, que é por isso HBase é referido como um armazenamento de dados orientada a coluna.
Row Key | Coluna Família: {coluna Qualifier: Versão: Valor} |
---|---|
00001 | CustomerName: { 'FN': 1383859182496: 'John', 'LN': 1383859182858: 'Smith', 'MN': 1383859183001: 'Timóteo', 'MN': 1383859182915: 'T'} ContactInfo: { 'EA': 1383859183030:'[email protected] ', 'SA': 1383859183073: «1 Hadoop Lane, NY11111 '} |
00002 | CustomerName: { 'FN': 1383859183103: 'Jane', 'LN': 1383859183163: 'Doe', Informação de contacto: { 'SA': 1383859185577: «7 HBase Ave, CA22222 '} |
A tabela mostra duas famílias de colunas: CustomerName e ContactInfo. Ao criar uma tabela em HBase, o desenvolvedor ou administrador é necessário para definir uma ou mais famílias de colunas usando caracteres imprimíveis.
Geralmente, as famílias de colunas permanecem fixas durante todo o tempo de vida de uma tabela HBase, mas novas famílias de colunas podem ser adicionadas usando comandos administrativos. A recomendação oficial para o número de famílias de colunas por tabela é de três ou menos. (Veja a HBase documentação on-line.)
Além disso, você deve armazenar dados com padrões de acesso semelhantes na mesma família coluna - você não gostaria que o nome do meio de um cliente armazenado em uma família de colunas separado do primeiro ou último nome porque você geralmente aceder a todos os dados de nome, ao mesmo tempo.
famílias de colunas estão reunidos no disco, portanto, agrupamento de dados com padrões de acesso semelhantes reduz o acesso total do disco e aumenta o desempenho.