L'importance de SQL pour Hadoop

Il ya des raisons impérieuses que SQL a su résister. L'industrie des TI a eu 40 ans d'expérience avec SQL, car il a d'abord été développé par IBM au début des années 1970. Avec l'augmentation de l'adoption de bases de données relationnelles dans les années 1980, SQL est depuis devenu une compétence standard pour la plupart des professionnels de l'informatique.

Vous pouvez facilement voir pourquoi SQL a été un tel succès: Il est relativement facile à apprendre, et les requêtes SQL sont tout à fait lisible. Cette facilité peut être retracée à un point de la conception de base en SQL - le fait qu'il est un déclaratif langue, par opposition à un impératif langue.

Pour qu'une langue soit déclarative que vos requêtes ne traitent que de la nature des données demandées - idéalement, il devrait y avoir rien dans votre requête qui détermine Comment le traitement doit être exécuté. En d'autres termes, tout ce que vous indiquez dans SQL est ce que les informations que vous souhaitez récupérer le système - pas comment l'obtenir.

En revanche, avec un langage impératif (C, par exemple, ou Java, ou Python) votre code se compose d'instructions où vous définissez les actions que vous devez le système à exécuter.

En plus des compétences (effet de levier) de facilement vos professionnels de l'informatique SQL-friendly, la valeur des applications de base de données de décennies ont également été construit avec des interfaces SQL. Quand on parle de la façon dont Hadoop peut compléter l'entrepôt de données, il est clair que les organisations vont stocker des données structurées dans Hadoop. Et en conséquence, ils vont courir une partie de leur logique applicative existante contre Hadoop.

Personne ne veut payer pour les applications d'être réécrit, donc une interface SQL est hautement souhaitable.

Avec le développement des interfaces SQL aux données Hadoop, une tendance intéressante est que l'analyse d'affaires commerciales et des outils de gestion des données sont presque tous sauter dans le train Hadoop, y compris l'intelligence d'affaires Reporting- Extrait packages- statistique, transformer, et les cadres de charge (ETL) - et une variété d'autres outils. Dans la plupart des cas, l'interface aux données Hadoop Hive est.


» » » » L'importance de SQL pour Hadoop