La création de grandes structures de données gérables

Comme l'informatique a emménagé dans le marché commercial, les données ont été stockées dans des fichiers plats qui ont imposé aucune structure. Aujourd'hui, Big Data nécessite des structures de données à gérer. Lorsque les entreprises ont besoin pour arriver à un niveau de compréhension détaillée sur les clients, ils ont dû appliquer des méthodes de force brute, y compris les modèles de programmation très détaillées pour créer de la valeur.

Plus tard dans les années 1970, les choses ont changé avec l'invention du modèle de données relationnel et le système de gestion de base de données relationnelle (SGBDR) qui a imposé structure et une méthode pour améliorer la performance. Plus important encore, le modèle relationnel ajouté un niveau d'abstraction de sorte qu'il était plus facile pour les programmeurs pour satisfaire les exigences croissantes de leurs activités pour extraire la valeur des données.

Le modèle relationnel offert un écosystème d'outils à partir d'un grand nombre de sociétés de logiciels émergents. Il a rempli un besoin croissant d'aider les entreprises à mieux organiser leurs données et être en mesure de comparer les transactions d'une géographie à l'autre.

En outre, il a aidé les gestionnaires d'entreprises qui voulaient être en mesure d'examiner des informations telles que l'inventaire et le comparer à l'information de commande d'un client à des fins de prise de décision. Mais un problème est ressorti de cette explosion de la demande pour les réponses: stocker ce volume croissant de données était cher et accède il était lent. Pour empirer les choses, beaucoup de duplication de données existaient, et la valeur de l'entreprise réelle de ces données était difficile à mesurer.

Lorsque le volume de données que les organisations nécessaires pour gérer grandi hors de contrôle, l'entrepôt de données a fourni une solution. L'entrepôt de données a permis à l'organisation de la TI pour sélectionner un sous-ensemble des données stockées de sorte qu'il serait plus facile pour l'entreprise pour essayer de mieux comprendre.

L'entrepôt de données a été conçu pour aider les entreprises à faire face à de plus en plus de grandes quantités de données structurées dont ils avaient besoin pour être en mesure d'analyser en réduisant le volume des données à quelque chose de plus petit et plus ciblé sur une zone particulière de l'entreprise. Il a rempli la nécessité de séparer décision opérationnelle traitement de soutien et aide à la décision - pour des raisons de performance.

Entrepôts stockent souvent les données des années antérieures pour comprendre la performance organisationnelle, l'identification des tendances, et en aidant à exposer des modèles de comportement. Il a également fourni une source intégrée de l'information à travers diverses sources de données qui pourraient être utilisées pour l'analyse. Aujourd'hui, les deux systèmes de gestion de contenu et des entrepôts de données sont en mesure de tirer parti des améliorations en termes d'évolutivité du matériel, les technologies de virtualisation, et la capacité à créer des systèmes matériels et logiciels intégrés.

Parfois, ces entrepôts de données eux-mêmes étaient trop vaste et complexe et ne pas offrir la vitesse et l'agilité que l'entreprise nécessaire. La réponse a été un raffinement supplémentaire des données étant géré par des data marts. Ces magasins de données ont porté sur des questions commerciales spécifiques et ont soutenu la nécessité d'affaires pour les requêtes rapides. L'entrepôt a évolué pour soutenir les technologies émergentes telles que les systèmes intégrés et les appareils de données.

Les entrepôts de données et de data marts résolus de nombreux problèmes pour les entreprises ayant besoin d'une manière cohérente pour gérer les données transactionnelles massives. Mais quand il est venu à gérer d'énormes volumes de données non structurées ou semi-structurées, l'entrepôt n'a pas pu évoluer suffisamment pour répondre aux besoins changeants.


Pour compliquer les choses, les entrepôts de données sont généralement nourris à des intervalles de lots, généralement hebdomadaire ou quotidienne. Ceci est très bien pour la planification, le reporting financier, et des campagnes de marketing traditionnelles, mais est trop lent pour de plus en plus entreprises et des consommateurs environnements en temps réel.

Comment seraient entreprises en mesure de transformer leurs méthodes de gestion de données traditionnelles pour gérer le volume croissant d'éléments de données non structurées? La solution n'a pas émergé pendant la nuit. Alors que les entreprises ont commencé à stocker des données non structurées, les vendeurs ont commencé à ajouter des fonctionnalités telles que BLOB (binary large object).

En substance, un élément de données non structurées seraient stockées dans une base de données relationnelles en tant que bloc contigu d'une données. Cet objet peut être étiqueté, mais on ne pouvait pas voir ce qui était à l'intérieur de cet objet. De toute évidence, cela a été ne va pas résoudre les besoins changeants des clients ou d'affaires.

Entrez le système de gestion de base de données objet (ODBMS). La base de données de l'objet stocké le BLOB comme un ensemble adressable de pièces afin que vous puissiez voir ce qui était là. Contrairement à la BLOB, qui était une unité indépendante jointe à une base de données relationnelle traditionnelle, la base de données de l'objet fourni une approche unifiée pour traiter les données non structurées.

Bases de données d'objets comprennent un langage de programmation et une structure pour les éléments de données de sorte qu'il est plus facile de manipuler différents objets de données sans programmation complexe et jointures. Les bases de données objet introduit un nouveau niveau d'innovation qui a aidé à mener à la deuxième vague de la gestion des données.


» » » » La création de grandes structures de données gérables