La Cross-Industry Standard Process for Data Mining (CRISP-DM) Est le cadre dominant du processus de data mining. Il est un quelqu'un normalisation ouverte peut l'utiliser. La liste suivante décrit les différentes phases du processus.

  • La compréhension de l'activité: Obtenez une compréhension claire du problème que vous êtes hors de résoudre, comment elle influence votre organisation, et vos objectifs pour y faire face. Les tâches de cette phase comprennent:

  • Identification de vos objectifs d'affaires

  • Évaluer votre situation

  • Définir vos objectifs d'exploration de données

  • Produire votre plan de projet

  • Compréhension des données: Passez en revue les données que vous avez, documenter, d'identifier la gestion des données et les problèmes de qualité de données. Tâches pour cette phase comprennent:

    • Rassembler des données

    • Décrivant

    • Exploration

    • Vérification de la qualité

    • La préparation des données: Obtenez vos données prête à l'emploi pour la modélisation. Tâches pour cette phase comprennent:

      • Sélection des données

      • Nettoyage des données


      • Construire

      • Intégrer

      • Formatage

      • Modélisation: Utilisez des techniques mathématiques pour identifier les tendances au sein de vos données. Tâches pour cette phase comprennent:

        • Sélection techniques

        • Tests de Design

        • Modèles de construction

        • Evaluation des modèles

        • Évaluation: Passez en revue les modèles que vous avez découverts et évaluer leur potentiel pour une utilisation professionnelle. Tâches pour cette phase comprennent:

          • L'évaluation des résultats

          • Revoir le processus

          • Déterminer les prochaines étapes

          • Déploiement: Mettez vos découvertes à travailler dans les affaires courantes. Tâches pour cette phase comprennent:

            • Le déploiement de la planification (vos méthodes d'intégration des découvertes d'exploration de données en usage)

            • La présentation des résultats finaux

            • Revoir les résultats finaux