Comment utiliser avec achat-filtres de collaboration dans l'analyse prédictive

Un des systèmes de recommandation d'Amazon pour des utilisations d'analyse prédictive basée sur l'article filtrage collaboratif - distribuer un grand inventaire de produits à partir de la base de données de l'entreprise lorsqu'un utilisateur visualise un seul article sur le site. Vous savez que vous êtes à la recherche à un système basé sur l'article-filtrage collaboratif (ou, souvent, un système basé sur le contenu) si elle vous montre des recommandations à votre première vue d'élément, même si vous ne l'avez pas créé un profil.

Ressemble à la magie, mais il est pas. Bien que votre profil n'a pas encore été créé (parce que vous n'êtes pas connecté ou vous ne disposez d'aucun historique de navigation précédente sur ce site), le système prend ce qui équivaut à une conjecture: Il fonde sa recommandation sur l'article lui-même et ce que les autres clients consulté ou acheté après (ou avant) ils ont acheté cet article. Vous verrez donc un certain message à l'écran comme

  • Les clients ayant acheté cet article ont également acheté . . .

  • Les clients qui ont acheté des articles dans votre histoire récente ont également acheté. . .

  • Quels sont les autres articles les clients achètent après avoir regardé cet article?

En substance, la recommandation est basée sur la façon similaire l'élément actuellement affiché est d'autres articles, sur la base des actions de la communauté des utilisateurs.

Le tableau suivant montre une matrice échantillon de clients et les articles qu'ils ont achetés. Il sera utilisé à titre d'exemple sur la base de l'article de filtrage collaboratif.

ClientPoint 1Point 2Point 3Point 4Point 5Point 6
UNXXX
BXX
C X X
XXX
E XX
FXX XX
gX X
HX
je X

Maintenant, regardons un objet similitude calculé selon la formule cosinus de similitude. La formule pour la similarité cosinus est (A middot- B) / (|| A || || B ||), où A et B sont des éléments à comparer. Pour lire l'exemple suivant et découvrez comment similaire une paire de pièces sont, simplement localiser la cellule où les deux éléments se croisent. Le nombre sera compris entre 0 et 1. Une valeur de 1 signifie que les éléments sont parfaitement similitude 0 signifie qu'ils ne sont pas similaires.

Point 600000
Point 50,260,290,520,82 0
Point 40,320,350,32 0,820
Point 30,400,45 0,320,520
Point 20,67 0,450,350,290
Point 1 0,670,400,320,260
Point 1Point 2Point 3Point 4Point 5Point 6

Le système peut fournir une liste de recommandations qui sont au-dessus d'une certaine valeur de similitude ou peut recommander le haut n nombre d'objets. Dans ce scénario, vous pouvez dire que toute valeur supérieure ou égale à 0,40 est similarités, le système recommande ces articles.

Par exemple, la similitude entre les articles 1 et 2 est de 0,67. La similitude entre l'article 2 et de l'article 1 est le même. Ainsi, il est une image miroir de l'autre côté de la diagonale du bas à gauche au coin supérieur droit. Vous pouvez également voir que le point 6 est pas semblable à tous les autres articles, car il a une valeur de 0.

Cette mise en œuvre d'un système de recommandation basée sur l'article est simplifiée pour illustrer comment cela fonctionne. Pour plus de simplicité, utiliser un seul critère pour déterminer article similitude: si l'utilisateur a acheté le produit. Des systèmes plus complexes pourraient aller plus en détail par

  • Utilisation de profils créés par les utilisateurs qui représentent leurs goûts

  • La prise en compte de l'utilisateur de combien aime (ou très taux) un article

  • Pesant le nombre d'éléments à l'utilisateur achetées, qui sont similaires à l'élément recommandé de potentiel (s)

  • Faire des hypothèses quant à savoir si un utilisateur aime un article sur la base de si l'utilisateur a simplement lu l'article, même si aucun achat a été effectué

Voici deux façons courantes que vous pourriez utiliser ce système de recommandation:

  • Hors ligne via une campagne de marketing par e-mail ou si l'utilisateur est sur le site tout en étant connecté.

    Le système pourrait envoyer des annonces de marketing ou de faire ces recommandations sur le site:

  • Point 3 au Client B

    Recommandé, car la clientèle B acheté des articles 1 et 2, et les deux éléments sont similaires à l'article 3.

  • Point 4, puis Point 2, au Client C

    Recommandé, car la clientèle C acheté des articles 3 et 5. L'article 5 est similaire à Point (valeur de similitude: 0,82) 4. Point 2 est similaire à Point (valeur de similitude: 0,45) 3.

  • Point 2 à la clientèle D

    Recommandé, car la clientèle D acheté des articles 3, 4 et 5. L'article 3 est similaire à l'article 2.

  • Article 1 à la clientèle E


    Recommandé, car la clientèle E articles achetés 2 et 3, les deux qui sont similaires à l'article 1.

  • Point 3 au Client F

    Recommandé, car la clientèle F acheté des articles 1, 2, 4 et 5. Les articles 1, 2 et 5 sont similaires à l'article 3.

  • Point 2 au Client G

    Recommandé, car la clientèle G acheté des articles 1 et 3. Ils sont à la fois semblable à l'article 2.

  • Point 2, puis Point 3, au Client H

    Recommandé, car la clientèle H acheté point 1. Point 1 est similaire à Articles 2 et 3.

  • Article indéterminée à la clientèle A

    Idéalement, vous devriez avoir beaucoup plus d'articles et utilisateurs. Et il devrait y avoir certains éléments que le client a achetés qui sont similaires à d'autres éléments qu'il ou elle n'a pas encore achetés.

  • Article indéterminée à la clientèle, je

    Dans ce cas, les données sont insuffisantes pour servir de base d'une recommandation. Ceci est un exemple du problème de démarrage à froid.

  • En ligne via une page vue pendant que l'utilisateur ne soit pas connecté.


  • » » » » Comment utiliser avec achat-filtres de collaboration dans l'analyse prédictive