Text Analytics for big données non structurées

De nombreuses méthodes existent pour l'analyse de données non structurées pour votre grande initiative de données. Historiquement, ces techniques sont sortis de domaines techniques tels que traitement du langage naturel (NLP), la découverte de connaissances, extraction de données, la recherche d'information, et les statistiques. Text Analytics est le processus d'analyse des textes non structurés, extraire des informations pertinentes, et le transformer en informations structurées qui peuvent ensuite être mises à profit de diverses manières.

Les processus d'analyse et d'extraction de profiter de techniques qui proviennent en linguistique computationnelle, les statistiques et autres disciplines des sciences de l'ordinateur.

Parfois, un exemple peut aider à expliquer un sujet complexe. Supposons que vous travaillez pour le département marketing d'une compagnie de téléphone sans fil. Vous venez de lancer deux nouveaux plans d'appels - plan A et Plan B - et vous ne recevez pas l'absorption vous vouliez sur le plan A. Le texte non structuré à partir des centres d'appels pourrait notes vous donner un aperçu de ce pourquoi cela est arrivé.

image0.jpg

Les mots soulignés fournissent les informations dont vous pourriez avoir besoin de comprendre pourquoi le plan A ne gagne pas l'adoption rapide. Par exemple, l'entité plan A apparaît à travers les notes des centres d'appel, indiquant que les rapports mentionnent le plan.

Les termes minutes roll-over, les données de 4 Go, d'un plan de données, et cher sont la preuve qu'un problème existe avec roll-over minutes, le plan de données, et le prix. Des mots comme ridicule et stupide donner un aperçu du sentiment de l'appelant, qui dans ce cas est négatif.

Le processus d'analyse de texte utilise différents algorithmes, tels que la structure compréhension de la phrase, pour analyser le texte non structuré puis extraire des informations, et de transformer ces informations en données structurées. Les données structurées extraites du texte non structuré est illustrée dans le tableau 13-1.

IdentifiantEntitéProblèmeSentiment
Cust XYZPlan AMinutes de roll-overNeutre
Cust ABCPlan AMinutes de roll-overNégatif
XXXXPlan ACherNeutre
XXXXPlan APlan de donnéesNeutre
Cust XYTPlan APlan de donnéesNégatif

Vous pouvez regarder et dire, “ Mais je aurait compris cela en regardant les dossiers des centres d'appel n ° 148. Cependant, ce sont juste un petit sous-ensemble de l'information enregistrée par des milliers d'agents de centre d'appels. Chaque agent individu ne peut éventuellement détecter une tendance générale en ce qui concerne le problème à chaque plan offert par la société.

Les agents ne disposent pas du temps ou obligation de partager cette information dans tous les autres agents de centre d'appels qui peuvent être obtenir des chiffres similaires des appels concernant le Plan A. Cependant, après ces informations sont agrégées et traitées à l'aide d'analyse de texte algorithmes, une tendance peut émerger de ces données non structurées. Voilà ce qui rend l'analyse de texte si puissant.


Recherche sur la récupération est un document basé sur ce que les utilisateurs finaux savent déjà qu'ils recherchent. Text Analytics est de découvrir des informations. Bien que l'analyse de texte diffère de recherche, il peut augmenter les techniques de recherche. Par exemple, l'analyse de texte combinés à la recherche peuvent être utilisés pour fournir une meilleure catégorisation ou la classification des documents et à produire des résumés ou des résumés de documents.

Il existe quatre technologies: requête, l'extraction de données, la recherche et l'analyse de texte. Sur le côté gauche de la table sont interrogation et de recherche, qui sont à la fois à propos de la récupération. Par exemple, un utilisateur final peut interroger une base de données pour savoir combien de clients ont cessé d'utiliser les services de l'entreprise au cours du mois passé.

La requête reviendrait un numéro unique. Seulement en demandant des requêtes de plus en différentes sera l'utilisateur final obtenir les informations nécessaires pour déterminer pourquoi les clients quittent. De même, la recherche mot-clé permet à l'utilisateur final de trouver les documents qui contiennent les noms des concurrents de l'entreprise. La recherche reviendrait un groupe de documents. Seule la lecture des documents serait l'utilisateur final venir avec des réponses pertinentes.

RécupérationPerspicacité
StructuréLes données de retour de la requête:L'exploration de données: Insight from données structurées
UnstructuredRecherche: retours documentsText Analytics: Insight from texte

Les technologies sur les pièces de retour d'information et à gauche nécessitent une interaction humaine à synthétiser et à analyser ces informations. Les technologies sur le droit - l'analyse d'exploration de données et de texte - offrent un aperçu beaucoup plus rapidement. Espérons que, la valeur de l'analyse de texte à votre organisation est de plus en plus clair.


» » » » Text Analytics for big données non structurées