Famílias de coluna no Modelo de Dados HBase

Nos dados HBase colunas modelo são agrupados em famílias de colunas, que deve ser definido na frente durante a criação da tabela. famílias de coluna são armazenados em conjunto no disco, que é por isso HBase é referido como um armazenamento de dados orientada a coluna.

Visão Lógica de Informação ao Cliente Fale em HBase
Row KeyColuna Família: {coluna Qualifier: Versão: Valor}
00001CustomerName: { 'FN': 1383859182496: 'John',
'LN': 1383859182858: 'Smith',
'MN': 1383859183001: 'Timóteo',
'MN': 1383859182915: 'T'}
ContactInfo: { 'EA': 1383859183030:'[email protected] ',
'SA': 1383859183073: «1 Hadoop Lane, NY11111 '}
00002CustomerName: { 'FN': 1383859183103: 'Jane',
'LN': 1383859183163: 'Doe',
Informação de contacto: {
'SA': 1383859185577: «7 HBase Ave, CA22222 '}

A tabela mostra duas famílias de colunas: CustomerName e ContactInfo. Ao criar uma tabela em HBase, o desenvolvedor ou administrador é necessário para definir uma ou mais famílias de colunas usando caracteres imprimíveis.

Geralmente, as famílias de colunas permanecem fixas durante todo o tempo de vida de uma tabela HBase, mas novas famílias de colunas podem ser adicionadas usando comandos administrativos. A recomendação oficial para o número de famílias de colunas por tabela é de três ou menos. (Veja a HBase documentação on-line.)

Além disso, você deve armazenar dados com padrões de acesso semelhantes na mesma família coluna - você não gostaria que o nome do meio de um cliente armazenado em uma família de colunas separado do primeiro ou último nome porque você geralmente aceder a todos os dados de nome, ao mesmo tempo.

famílias de colunas estão reunidos no disco, portanto, agrupamento de dados com padrões de acesso semelhantes reduz o acesso total do disco e aumenta o desempenho.

menu