Familles de colonne dans le modèle de données HBase

Dans les données HBase colonnes du modèle sont regroupés en familles de colonne, qui doit être défini à l'avance lors de la création de la table. Familles de colonne sont stockés ensemble sur le disque, ce qui explique pourquoi HBase est considéré comme un magasin de données en colonnes.

Vue Logique du client Informations de contact dans HBase
Key RowColonne Famille: {Colonne Qualifier: Version: Valeur}
00001CustomerName: {«FN»: 1383859182496: «John»,
'LN': 1383859182858: «Smith»,
«MN»: 1383859183001: Timothy '',
«MN»: 1383859182915: 'T'}
ContactInfo: {'EA': 1383859183030:'[email protected] »,
«SA»: 1383859183073: «1 Hadoop Lane, NY11111 '}
00002CustomerName: {«FN»: 1383859183103: «Jane»,
'LN': 1383859183163: «Doe»,
Informations de contact: {
«SA»: 1383859185577: «7 HBase Ave, CA22222 '}

Le tableau montre deux familles de colonne: CustomerName et ContactInfo. Lors de la création d'une table dans HBase, le développeur ou l'administrateur est nécessaire pour définir une ou plusieurs familles de colonne à l'aide de caractères imprimables.

Généralement, les familles de colonnes restent fixes tout au long de la durée de vie d'une table HBase mais de nouvelles familles de colonnes peuvent être ajoutés à l'aide de commandes d'administration. La recommandation officielle pour le nombre de familles de colonnes par table est de trois ou moins. (Voir la documentation en ligne hbase.)

En outre, vous devriez stocker des données avec des modèles d'accès similaires dans la même famille de colonne - vous ne voudriez pas prénom d'un client stockées dans une famille de colonne séparée de la première ou de la dernière nom parce que vous accédez généralement toutes les données de noms dans le même temps.

Familles de colonnes sont regroupées sur le disque, le regroupement des données avec des modèles d'accès similaires réduit l'accès global de disque et augmente les performances.


» » » » Familles de colonne dans le modèle de données HBase