Analyse d’articles web sur le fonctionnement spécifique des recommandations sur Spotify

Source : Les algorithmes de recommandation musicale : ne bougez pas, on s’occupe de tout – CASSANDRE TARVIC – 2018

Spotify propose les Découvertes de la Semaine. C’est The Echo Nest qui a créé cet algorithme. Les plateformes de streaming accordent une grande importance au fait de pouvoir « deviner », prédire, les morceaux qui vont plaire à un utilisateur. Et les recommandations de Spotify via les découvertes de la semaine sont satisfaisantes pour les utilisateurs.

« L’outil Premier de Spotify » met en avant les « précurseurs », c’est à dire les 10% des personnes qui ont écouté l’artiste avant qu’il soit connu, ce qui invite et incite les utilisateurs à la découverte. C’est argument contre celui qui prône le manque de diversité dans les découvertes et dans les usages des utilisateurs.

Source : Où se cache la magie des algorithmes de recommandation musicale ? – Olivier Desbiey – 2016

Quartz Adam Pasick a enquêté auprès des ingénieurs qui gèrent le fonctionnement du système de recommandation de Spotify (Découverte de la Semaine) :

  • Un « profil de groût » est associé à chaque utilisateur, en fonction de ses écoutes et de ses sauvegardes.
  • En parallèle, il y a une analyse des playlists créer (environ 2 milliards) par les utilisateurs (collaborative filtering).

L’algorithme propose ainsi des morceaux qui se rapprochent des écoutes de l’utilisateur, mais qui n’ont pas encore été écouté par lui. C’est donc un gros travail de classement des utilisateurs en fonction de leur playlists.

Les responsables de la plateforme précisent aussi qu’ils ne font jamais de recommandations en fonction des demandes des artistes et des labels, même s’ils tentent très souvent de faire en sorte qu’un artiste ou un morceau soit appuyé dans les recommandations faites aux utilisateurs.

5% des utilisateurs de Spotify pensent que les recommandations sont personnalisées par des données contextuelles (ex : localisation). C’est cohérent, dans le sens où les ingénieurs responsables du système de recommandation précisent que l’algorithme qui est utilisé exclus volontairement des écoutes atypiques. Par exemple, si quelqu’un écoute une bande son de pluie en forêt pour s’endormir, il ne doit pas voir dans ses découvertes de la semaine des morceaux de ce type, même si l’heure d’écoute est une information utile à l’algorithme.

Source : Parlons recommandation : Partie 1 / Comprendre les modèles – Lisa Pujol – 2018 et Parlons recommandation : Partie 2 / Le modèle Spotify – Lisa Pujol – 2018

Tous les systèmes de recommandation basent leur méthode sur l’analyse d’interaction. Spotify utilise :

  • Le « collaboratif filtering » : mettre en cohérence les contenus en fonction de si les utilisateurs ont « vu/écouté/lu/acheté l’un et l’autre ». L’auteur prend l’exemple de recommandation de films : si un utilisateur à aimé le film A et le film B et qu’un autre utilisateur à aimé le film A aussi, on lui proposera de regarder le film B. C’est un système souvent utiliser pour proposer des produits complémentaires (cross-selling). Par exemple, proposer « une housse d’ordinateur à l’achat d’un mac ». Spotify utilise les données des utilisateurs qui concernent la navigations, l’écoute et les playlists. Le système de recommandation de Spotify déduit que deux utilisateurs ont des goûts similaires s’ils écoutent les mêmes morceaux. Donc ce qu’écoute l’un peut intéresser l’autre. Donc, si l’un écoute une chanson en plus de celles qu’ils ont en commun, Spotify recommandera à l’autre profil ce même morceau, et inversement.
  • Le « content-based filtering » : mettre en lien des informations sur les contenus des produits. Le but est de proposer des produits qui se rapprochent caractéristiquement des produits déjà aimés. Ce sont les caractéristiques des produits qui sont analysés. Le content-base filtering se base à la fois sur :
    • Une analyse textuelle : ce qui se dit de l’artiste, album, à quelle fréquence, de quoi on parle d’autre en même temps, etc. ==> « top terms » avec des poids différents selon la probabilité d’utilisation du terme en question pour qualifié l’artiste ou le morceau.
    • Une analyse sonore : rythme, tempo, niveau de basses … Le but est de données des caractéristiques à un contenu. L’avantage de cette méthode, c’est que ça évite la discrimination et la redirection automatique vers des contenu déjà connu. Par exemple, si un artiste peu connu cumule 50 écoutes, l’analyse textuelle et le collaboratif filtering ne serait pas suffisant pour faire augmenter le nombre d’écoute (peu de « match » probables entre les utilisateurs et peu de données textuelle sur internet sur l’artiste ou le morceau). Alors que si on ajoute l’analyse sonore, la chanson de l’artiste peu connu a autant de chance d’être ajoutée dans une playlist qu’une chanson connu.

Laisser un commentaire