Versões de dados no modelo de dados HBase
Você pode ver um número entre o qualificador de coluna e valor ( "FN": 1383859182496: 'John', por exemplo). Esse número é o versão número para cada valor na tabela. Valores armazenados em HBase são tempo carimbado por padrão, o que significa que você tem uma maneira de identificar diferentes versões de seus dados para a direita fora da caixa.
Row Key | Coluna Família: {coluna Qualifier: Versão: Valor} |
---|---|
00001 | CustomerName: { 'FN': 1383859182496: 'John', 'LN': 1383859182858: 'Smith', 'MN': 1383859183001: 'Timóteo', 'MN': 1383859182915: 'T'} ContactInfo: { 'EA': 1383859183030:'[email protected] ', 'SA': 1383859183073: «1 Hadoop Lane, NY11111 '} |
00002 | CustomerName: { 'FN': 1383859183103: 'Jane', 'LN': 1383859183163: 'Doe', Informação de contacto: { 'SA': 1383859185577: «7 HBase Ave, CA22222 '} |
É possível criar um esquema de controle de versão de costume, mas os usuários normalmente ir com um carimbo de tempo criada usando o tempo atual Unix. (O tempo de Unix ou Unix época representa o número de milissegundos desde a meia-noite 01 de janeiro de 1970 UTC.) Os dados de versão é armazenado em ordem decrescente, de modo a que o valor mais recente é retornado por defeito, a menos que uma consulta especifica um timestamp particular.
Você pode ver que a empresa serviço fictício no início só tinha uma inicial para o segundo nome de John Smith, mas, em seguida, mais tarde, eles aprenderam que o Nº 147-T # 148- representava # 147-Timothy. # 148- O valor mais recente para a coluna de 'MN' é armazenado em primeiro lugar na tabela.
Você pode definir um limite para a quantidade de tempo que os dados podem ficar em HBase com uma variável chamada tempo de vida (TTL). Você também pode definir uma variável que controla o número de versões por valor. Isto pode ser feito por família coluna.