Faire face à des problèmes de qualité dans vos données clients

Comme vous creusez dans vos données clients pour construire des campagnes de marketing ou de chercher un aperçu de votre clientèle, vous serez inévitablement confronté à la mauvaise qualité des données, parfois appelé données sale

Sommaire

. Votre base de données client est construit en utilisant des flux de données à partir d'une variété de sources différentes, y compris les systèmes internes de l'entreprise ainsi que les fournisseurs de données tiers. Les données de ces systèmes varie en qualité, la fraîcheur et la cohérence.

Les noms et adresses peuvent être formatées différemment dans les différents systèmes. Et ils changent au fil du temps, ce qui explique pourquoi les maintenir à jour est si important.

Mais ce genre de variation des données est pas unique à l'information de contact client. Votre base de données est pleine de potentiels mines de qualité des données. En réflexion critique sur les données que vous analysez, vous pouvez éviter des interprétations inexactes ou trompeuses de vos données clients.

Sortez le (données) des ordures

L'approche idéale est de bien analyser vos données avant qu'il ne soit même chargé à votre base de données. De cette façon, vous pouvez corriger certains problèmes avant qu'ils peuvent gâcher votre analyse. Dans certains cas, vous devrez peut-être fait rejeter les données à partir de votre base de données si elle ne répond pas à certaines normes de qualité.

Vous devez analyser soigneusement chaque élément de données individuelles. Vérifiez qu'il est dans le bon format, certainement. Mais aussi vérifier que chaque valeur fait réellement sens. Ces formats des valeurs raisonnables et sont différents pour chaque élément de données.

Par exemple, il ya clairement un problème si vous avez tout un tas de clients dont l'âge est classé 99. Cela est probablement une indication que l'âge de la clientèle était indisponible, et 99 était une valeur par défaut dans le système source. Ce genre de chose arrive fréquemment avec les données des registres de trésorerie liés aux achats d'alcool. Les caissiers sont forcés d'entrer une date de naissance pour compléter la transaction, mais souvent ils ne demandent même pas la question. Ils clé simplement une valeur par défaut.

L'âge est quelque chose que vous pouvez utiliser pour prendre des moyennes ou faire d'autres calculs. Le fait que cette valeur par défaut ressemble superficiellement un âge réel signifie qu'il peut bousiller ces calculs. Dans ce cas, il est une bien meilleure idée de remplacer la valeur par défaut avec une valeur manquante ou nul valeur. Pratiquement tous les moteurs de base de données permettent ce type de valeur.


La plupart des moteurs de reporting et des techniques de modélisation statistique sont tout à fait aptes à traiter avec ces valeurs nulles. Certaines techniques statistiques, cependant, nécessaire de remplacer ces valeurs manquantes avec une certaine valeur moyenne ou exclure complètement les dossiers. Dans les deux cas, sachant que la valeur est manquante est mieux que de supposer à tort la valeur est significative.

Méfiez-vous des données périmées

L'âge de la clientèle est un bon exemple d'un autre problème que vous pourriez rencontrer. Le temps passe, comme dit le proverbe. Si vous avez chargé un enregistrement de client il ya 5 ans a montré que le client comme étant âgé de 35 ans, que l'information est plus précise. Votre premier réflexe est de résoudre le problème par la construction d'un processus visant à mettre à jour les âges de clients chaque année. Cela fonctionne en théorie, mais en pratique, il peut obtenir assez délicat. Chaque fois que vous mettez à jour l'âge, vous avez à regarder d'où viennent, et quand les données.

Une meilleure approche est de stocker les données de manière à ce que le problème disparaît. Vous pouvez facilement convertir l'âge d'une année de naissance lorsque vous chargez d'abord le dossier. Vous créez ensuite un autre élément de données qui contient essentiellement la valeur année en cours l'année de naissance de moins. Voil # 225- - aucun entretien nécessaire. Le moteur de base de données sait toujours quelle année il est, donc cette valeur d'âge ne sera jamais besoin d'être mis à jour.

En réflexion critique sur vos données avant qu'il ne soit chargé dans votre base de données, vous pouvez éviter de nombreux problèmes de qualité des données. Mais ne soyez pas complaisants. Systèmes de Source changent avec le temps, et ces changements provoquent des changements en aval dans la façon dont les données est passé à votre base de données clients. Il est une bonne idée de vérifier vos données de manière proactive à l'occasion de vérifier les données suspectes.


» » » » Faire face à des problèmes de qualité dans vos données clients