Analyse des clients et des périodes de formation et de validation

Une approche sophistiquée et souvent essentiel à l'analyse de séries chronologiques implique le partitionnement des données clients en périodes de formation et de validation. Dans la période de formation, vous construisez une équation de régression à la première section de données (environ les deux tiers à trois quarts de vos données).

Vous pouvez ensuite appliquer l'équation de régression pour la dernière partie de vos données dans la période de validation pour voir comment les données antérieures prédit réellement les données ultérieures.

Avec les données d'abonné, vous pouvez utiliser les 20 premiers mois (Janvier 2012 à Août 2013) que la période de formation et de Septembre 2013 à Février 2014 comme la période de validation. Cette approche est de tester l'équation en utilisant les données que vous avez déjà, qui est aussi proche que vous pouvez obtenir de tester la façon dont une prédiction pourrait effectuer lorsque de nouvelles données entre en jeu.

L'équation de régression pour les 20 premiers mois est:

Abonnés = 2033.9e0,0269X

Le r# 178- = 0,9979, ce qui montre un bon ajustement pour la ligne exponentielle. Vous pouvez ensuite utiliser cette équation de régression pour voir comment il prédit les six derniers mois de l'ensemble de données. Les six derniers mois sont 21 à 26. La figure montre les valeurs prédites et réelles pour Août 2013 à Février 2014, étiquetés de validation (dans la colonne Période).

image0.jpg

Pour évaluer dans quelle mesure cette prédiction est effectivement, deux colonnes supplémentaires ont été créés. Le premier est l'erreur brute du nombre réel de la prédiction. Par exemple, en Septembre 2013, la prévision était à court de 5 abonnés. En Février 2014, il était à court de 28. Ce genre d'erreur brut peut être en soi compréhensible, si vous êtes familier avec les données du client vous travaillez avec.

Lors de la communication combien erreur vos valeurs prédites ont, il est souvent plus facile de parler en termes de pourcentage d'erreur.

L'erreur moyenne de pourcentage absolu (MAPE) peut être un peu plus compréhensible pour les parties prenantes. Il est calculé en trouvant la valeur absolue de la différence entre les valeurs réelles et prédites, puis en divisant cette différence par la valeur réelle pour calculer le pourcentage d'erreur absolue. Cette moyenne est ensuite pour chaque valeur.

image1.jpg

La colonne APE montre le pourcentage d'erreur absolue. Par exemple, pour Janvier 2013, l'équation de régression prédit 2885 subscribers- le nombre réel d'abonnés était 2844, ce qui signifie l'équation surestimé par 41 abonnés.

En appliquant la formule Excel pour l'erreur absolue en pourcentage (APE) génère une erreur de 1,4%:

= ABS (2885-2844) / 2,885 = 0,014 ou 1,4%

Le MAPE pour la période de formation est 0,589%. Le MAPE pour la période de validation est 0,870%, ce qui est un peu plus élevé, mais les deux sont encore sous 1%.

Enfin, les prévisions pour Mars, Avril et mai 2014 sont 4205, 4320, et 4437.

= EXP (0,0269 * 27) * 2033,9 = 4205
= EXP (0,0269 * 28) * 2033,9 = 4320
= EXP (0,0269 * 29) * 2033,9 = 4437

Il ya un certain nombre de techniques plus sophistiquées qui peuvent faire des modèles plus précis en prenant en compte la saisonnalité et de l'autocorrélation, puis lisser les données afin de mieux interpréter les motifs. Des logiciels tels que JMP et Minitab ont ces fonctionnalités intégrées.

Prédire l'avenir est toujours risqué parce que vous êtes en supposant l'avenir avoir des motifs similaires à ceux du passé. Dans la plupart des cas, il fait et peut être un excellent indicateur du comportement de la clientèle. Cependant, des événements inhabituels (outrés clients sur les médias sociaux, une attaque terroriste, ou récession) qui sont imprévisibles peuvent considérablement affecter la précision de vos prédictions. Traiter prédictions comme un guide, pas un absolu.


» » » » Analyse des clients et des périodes de formation et de validation