Deux ou trois choses que nous savons des dispositifs de recommandation

Au terme du programme mené au sein de la Chaire PcEN sur les dispositifs de recommandation mobilisés par les services culturels en ligne, nous livrons le bilan de ce travail.

1. La recommandation, enjeu majeur des services culturels en ligne

Face à l’hyper abondance du volume d’informations disponibles en ligne, les systèmes de tri ou de filtrage sont devenus indispensables. Dans le processus de guidage d’un internaute, au terme duquel seule une infime partie de ce qui existe sur Internet lui est perceptible, le design d’interface des offreurs de service en ligne est une composante essentielle. Le choix est généralement présenté de manière hiérarchique, organisé selon différents critères, qui incitent l’utilisateur à s’orienter vers tel ou tel type d’informations. Du streaming musical à la vidéo à la demande, en passant par les jeux vidéo, les services mettent en avant certaines propositions plutôt que d’autres sur leur interface, attirant l’attention de l’utilisateur, l’incitant à s’orienter vers tel ou tel contenu, contribuant à le guider dans son choix au sein de l’océan numérique.

Les outils de recommandation agissent comme intermédiaires de présélection et participent en cela à ce que l’on nomme la « découvrabilité » de certains contenus par les usagers. Pour des services comme Netflix, Amazon Prime Vidéo, ou Spotify, la simple présence d’un titre dans leur vaste catalogue n’implique pas qu’il soit automatiquement « découvrable » par l’utilisateur. La découvrabilité d’un contenu dépend de multiples facteurs tels que la qualité des métadonnées associées aux contenus, les stratégies marketing mises en œuvre sur les réseaux sociaux, la connaissance des usages par les professionnels ou les politiques publiques de promotion de ce type de contenus. Parmi les facteurs expliquant que certains contenus se trouvent mis en avant sur l’interface, les dispositifs de recommandation sont donc l’une des clés de la découvrabilité d’un contenu par l’utilisateur.

Ces dispositifs constituent un enjeu majeur pour l’ensemble des acteurs des filières culturelles, usagers, entreprises et ayants droit. Pour le régulateur européen, le sujet de la recommandation est au carrefour de tensions contradictoires entre la liberté des entreprises de choisir leur modèle économique et des considérations jugées d'intérêt général, comme la lutte contre les fake news, les contenus haineux ou la préservation de la diversité culturelle.

En raison de l’importance des dispositifs de recommandation, la diversité des catalogues est un objectif mal adapté à l’économie des services à la demande puisqu’il importe peu, en termes d’objectifs de promotion de la diversité, qu’un grand nombre d’œuvres soient disponibles en stock, si très peu d’entre elles sont effectivement visibles. Dans l’audiovisuel, imposer des quotas d’œuvres dans les catalogues peut inciter les services à acheter des œuvres françaises et européennes mais ne conduit pas automatiquement à les rendre plus visibles, en France comme dans le processus de rayonnement de l’audiovisuel français à l’étranger, s’ils ne sont pas mis en avant et par conséquent découvrables par les usagers. C’est pourquoi la directive SMA du 14 novembre 2018 prévoit la mise en avant des œuvres européennes par les services, ajoutant à l’approche quantitative des quotas, une méthode plus dynamique de promotion de certains contenus.

2. Tous les dispositifs de recommandation ne mobilisent pas des algorithmes

La recommandation n’est pas, à ce stade, une notion qui fait l’objet d’une qualification juridique claire et stabilisée. Chacun des services concernés mobilise ses propres mécanismes de classement, qu’on les nomme référencement pour les moteurs de recherche, prescription ou recommandation pour les réseaux sociaux et les services d’offre de contenus culturels. La notion renvoie à une pluralité de dispositifs qui peuvent être classés selon différentes typologies et qui ne renvoient pas tous, loin de là, à la mobilisation de traitements algorithmiques même si ce sont eux qui sont les plus nouveaux et sur lesquels se polarise l’attention.

Deux formes, la recommandation éditoriale et la recommandation personnalisée sont particulièrement impliquantes pour le fournisseur de service dans la mesure où, selon une logique d’offre, l’agent économique qui met à disposition des contenus en ligne exerce une action volontaire et maîtrisée. Avec la recommandation éditoriale, le service assume de pousser telle ou telle catégorie de contenus, selon ses propres jugements, vers l’ensemble des utilisateurs. Avec la recommandation personnalisée, associée à l’exploitation de données, le service propose à chaque utilisateur, selon ses goûts présumés, des contenus adaptés.

Une autre distinction oppose, selon la nature des traitements opérés, les recommandations fondées sur des traitements humains aux recommandations basées sur des traitements automatisés algorithmiques. S’il est courant d’associer la recommandation éditoriale à des traitements humains, et la recommandation personnalisée à des traitements algorithmiques, les deux notions ne se confondent pas systématiquement. Pour les services en ligne offrant un vaste catalogue, l’éditorialisation intègre bien souvent des traitements automatisés ; à l’inverse, la qualification des contenus associée à la recommandation personnalisée requiert, la plupart du temps, en amont, des choix humains décisifs. De plus, de nombreux dispositifs mêlent outils automatiques et traitement humain et la prégnance respective des différentes modalités de recommandation varie selon les dispositifs envisagés.

Avec le numérique, la possibilité d’exploiter une grande quantité de données d’usage sur les comportements des internautes a conduit à l’émergence de formes de recommandation personnalisée associée aux potentialités des traitements algorithmiques automatisés. L’essence même de ces algorithmes est d’offrir, de manière automatisée, une sélection réduite de la masse d’informations disponibles. Ces outils de recommandation automatisée et personnalisée, qui se sont largement développés, suscitent de nombreuses inquiétudes.

3. Des dispositifs algorithmiques qui inquiètent sans faire l’objet de validations empiriques

L'effet des algorithmes sur le filtrage des informations des services en ligne est au cœur de vives interrogations. Si un algorithme n’est jamais « neutre » puisqu’il reflète des choix préalables de types de données et de systèmes de traitements mobilisés, la question du résultat des modalités de filtrage proposées, de façon plus ou moins transparente, mérite d’être traitée attentivement. Le processus de mise en avant conduit il à la sur-représentation de certains contenus et, en miroir, à la sous-représentation d’autres contenus ?

La surreprésentation de certains contenus peut tout d’abord être liée aux intérêts directs de l’opérateur. La crainte de l’auto - préférence des fournisseurs de services numériques pour leurs propres contenus qui existe déjà dans le monde physique, renvoie pour les services en ligne au risque que les processus de mise en avant se portent sur des contenus produits par les plateformes, lorsque celles-ci sont devenues des acteurs intégrés.

D’autre part, les entreprises sont susceptibles de mettre en avant des contenus pour lesquels ont été passés des accords commerciaux, rapprochant en cela les dispositifs de recommandation de la publicité, et posant le problème de l’asymétrie dans les termes de la négociation selon l’attractivité de l’entreprise et/ou des contenus.

Enfin, la surreprésentation de certains contenus peut également être liée à un enfermement de l’usager associé aux biais liés à la personnalisation de plus en plus fine et de plus en plus poussée des résultats proposés, qu’il s’agisse des moteurs de recherche, des réseaux sociaux ou des services culturels. La forte personnalisation des recommandations grâce aux outils algorithmiques, alimente, les craintes d’un enfermement dans des catégories de contenus limités. Dans son ouvrage à succès The Filter Bubble, Eli Pariser (2011) propose une définition assez vague de l’enfermement algorithmique, en l’assimilant à une bulle opaque, une sorte de prison, qui exclut la possibilité d’une découverte fortuite. En matière d’information, la question soulevée par la thèse de la « bulle de filtre » est celle de l’accès au pluralisme des opinions dans une société démocratique. Pour les services culturels, la crainte est celle d’une absence de diversité culturelle au profit d’un enfermement dans les goûts monomaniaques de l’usager.

Les études empiriques menées dans le domaine de l’information aboutissent à des résultats contrastés selon les situations. Dans le secteur culturel, il n’est pas rare d’entendre des inquiétudes sur la « bulle de filtre », parfois largement relayées par les médias français, sur la base d’intuitions ou de simples expériences personnelles. Les travaux scientifiques analysant de manière quantitative les effets de la recommandation dans les industries culturelles sont, quant à eux, quasiment inexistants.

4. Un protocole inédit d’expérimentation sur le cas emblématique de Netflix

Au sein de la Chaire PcEn, nous avons placé cette question de la mise en avant des contenus culturels et des stratégies de visibilité au cœur de notre programme de recherche.

Les études portant sur la composition des catalogues des services de streaming sont courantes et des conclusions sont parfois tirées sur la disponibilité ou l'indisponibilité de certaines œuvres. Cette approche qui a ses mérites (vue d'ensemble d'une offre de contenus, aperçu d'une stratégie d'acquisition...), néglige cependant la question de la visibilité de certains contenus par rapport à d'autres sur l'écran de l'utilisateur. La mise en avant dans une grille de programmes à la télévision n'est régie que par le temps : les programmes les plus mis en avant sont ceux diffusés pendant les tranches horaires de forte audience, le « prime-time ». Dans un univers non linéaire, la mise en avant dans l'espace correspond à la position de chaque titre sur la page, les plus proéminents étant ceux placés aux endroits les plus visibles. Dans le cas des services personnalisés, les titres les plus « découvrables » varient en fonction du comportement de chaque utilisateur. Cela signifie que la mise en avant sur ces services ne peut être appréhendée qu'au cas par cas.

Netflix, qui fait figure, historiquement, de poisson pilote de la recommandation algorithmique personnalisée, avec par ailleurs, 220 millions d’abonnés dans le monde dont plus de dix millions en France, constitue un terrain d‘expérimentation privilégié pour la recherche. Alors que le catalogue, zone abstraite comprenant tous les contenus disponibles sur le service à une date donnée, la page d’accueil, est un espace restreint du catalogue auquel l’utilisateur accède dès qu’il se connecte. La page d'accueil, page principale du site, est délimitée verticalement par la distance à laquelle l'utilisateur peut faire défiler la page et horizontalement, par la longueur de chaque rangée de vignettes. En mai 2022, on compte 5 272 titres différents disponibles au sein du catalogue de Netflix en France, dont 20% au maximum seulement sont présents sur les pages d’accueil. Autrement dit, un utilisateur ne se voit proposer sur la page d’accueil qu’une proportion limitée des contenus disponibles dans le catalogue, le reste lui demeurant largement « invisible ».

Le développement d’un protocole inédit d’expérimentation,¹ et la réalisation d’expériences, deux d’entre elles en particulier²,³ ont contribué à mieux comprendre, dans le cas spécifique de Netflix, l’effet de la recommandation sur les contenus mis en avant. Ces expériences, impliquant le visionnage automatisé de contenus par des robots simulant des comportements humains extrêmes, ont permis de suivre, pas à pas, l’évolution des pages d’accueil.

Une première expérience consistait, pendant huit jours, à ordonner à dix robots de visionner uniquement des contenus européens tandis que dix autres robots ne visionnaient que des contenus non européens. La catégorie « œuvre européenne » si elle reflète l’attention particulière du législateur européen, correspond cependant assez peu aux usages des spectateurs qui expriment rarement une appétence pour une catégorie aussi vague. C’est pourquoi, une seconde expérience s’est intéressée aux contenus japonais et coréens. Pendant dix jours, et à raison de trois heures par jour, cinq robots ont visionné uniquement des contenus coréens et cinq autres uniquement des contenus japonais. Grâce à une collaboration avec Seok-Kyeong Hong, professeure à l’université de Séoul, nous avons ainsi réalisé une analyse comparative de la mise en avant des contenus coréens et japonais sur Netflix en France. Les résultats de cette expérience ont été présentés à l’occasion d’une conférence à Séoul le 9 avril 2022, intitulée Is Netflix riding the Korean Wave or vice-versa ?

Plusieurs conclusions émergent de ces expériences.

Une personnalisation des pages d’accueil d’autant plus forte que la demande porte sur des productions correspondant à des goûts bien spécifiques.

Dès que l’utilisateur exprime ses goûts par ses comportements, la recommandation opère, réorganisant la page d'accueil initiale, vierge de toute trace de navigation. Chaque programme de visionnage entraîne une évolution progressive de la page d’accueil. C’est afin de répondre aux plus près à leurs attentes présumées que les algorithmes de recommandation personnalisée ont été mis en place et l’analyse des résultats confirme que chaque utilisateur possède un environnement qui lui est totalement singulier et que la personnalisation des pages d’accueil est bien réelle.

L’évolution est particulièrement marquée pour les profils adeptes de productions coréennes ou japonaises et les contenus issus de ces deux pays gagnent peu à peu en visibilité puis atteignent un plateau après quatre jours de visionnage. La personnalisation des pages d’accueil semble donc d’autant plus importante que les usagers expriment une demande pour des contenus présentant une forte distance culturelle avec ceux habituellement attendus sur le lieu de connexion comme les contenus français ou américains dont l’appétence des spectateurs français est attendue.

Pour les contenus japonais ou coréens au contraire, la nationalité rejoint de véritables communautés de goûts que l’algorithme cherche à préciser. En effet, alors que presque toutes les pages d'accueil contiennent les habituels « Top 10 en France », « Tendances actuelles » ou « Séries d'action et d'aventure », sur les pages des robots friands de contenus coréens, apparaissent progressivement des rangées personnalisées telles que « Drames coréens » et « Made in Korea », et, sur les pages d'accueil des robots friands de contenus japonais, des rubriques comme « Films japonais » ou « Animés de drames japonais ». Pour les deux groupes apparaissent également des rangées telles que « Films et séries d'Asie de l'est » ou « Séries dramatiques asiatiques » qui suggèrent, par thématiques, l’existence de mots clés communs aux contenus japonais et coréens.

La personnalisation, réelle des pages d’accueil n’est cependant pas totale.

L’absence de bulle de filtre

Les contenus coréens et japonais dominent les pages d’accueil des robots concernés mais des contenus appartenant à d’autres catégories continuent de bénéficier de visibilité.

De la même façon, les résultats montrent que les œuvres européennes ne disparaissent pas de la page d’accueil, même lorsque le robot regarde uniquement des titres non-européens. Par ailleurs, la recommandation opère un brassage important des œuvres européennes disponibles dans le catalogue : 92% de tous les titres européens disponibles (1 606 titres différents au total) sont apparus au moins une fois sur la page d’accueil de l’un des vingt robots (à des places certes différentes selon les cas).

La crainte d'une invisibilisation des contenus européens par les algorithmes paraît donc contredite par les résultats empiriques, dans le cas précis étudié. Plus largement, cette crainte semble exprimer deux difficultés. Tout d’abord, le manque de confiance des européens dans leurs propres contenus, supposés suffisamment peu attractifs pour devoir être systématiquement « poussés » artificiellement, surtout lorsqu’ils sont exposés par des services d’origine américaine. La multiplication de succès européens sur les services en ligne devrait rebattre les cartes. D’autre part, un climat de méfiance envers une entité impersonnelle, les algorithmes, d’autant moins connus et transparents que peu analysés sereinement, alimente les fantasmes.

Dans le cas de Netflix la personnalisation poussée des résultats conforme aux habitudes préalables se combine avec une forme d’ouverture afin de ne pas lasser un usager qui risquerait alors de se détourner du service. La fameuse bulle de filtre serait plus proche d’une bulle de savon que des murs d’une prison ; comme la bulle de savon, elle se produit à certains moments, dans certaines circonstances, mais reste toujours fragile, susceptible d’exploser à la moindre occasion. Les internautes ont accès à des portes de sortie qu’ils les saisissent, ou pas.

Des choix éditoriaux forts qui ne se limitent pas à un « push » généralisé des contenus « originaux »

Les résultats des pages d’accueil montrent que, quelles que soient les préférences exprimées par les robots, certains contenus apparaissent systématiquement sur l’ensemble des pages d’accueil et particulièrement en haut de ces pages. Les contenus éditorialisés sont loin d’être uniquement des « originals, catégorie au demeurant large et hétérogène.Ainsi, les pages d’accueil des robots ne font pas apparaître une plus grande mise en avant des originaux coréens et japonais par rapport aux non originaux issus de ces pays. Ces derniers peuvent en effet être mis en avant pour des raisons multiples : meilleures performances des non originaux, manque de contenus phares originaux issus de ces pays dans le catalogue…

Même pour un acteur supposé incarner la personnalisation massive, la recommandation éditoriale continue donc à jouer un rôle majeur dans la mise en visibilité. Netflix n'est plus un simple diffuseur mais un véritable investisseur dans la production audiovisuelle ; dans sa stratégie de recommandation, la firme assume une fonction éditoriale en mettant en avant certains contenus, indépendamment des goûts de chacun.

Les choix éditoriaux reflètent des situations sans doute fort diverses que les expériences menées ne suffisent pas à appréhender dans leur intégralité. L’investissement réalisé dans un contenu, le succès et le buzz inattendus que l’algorithme amplifie, ou encore, la résonance entre l’actualité et le thème traité sont, sans nul doute, parmi les facteurs conduisant à éditorialiser plus particulièrement certains contenus.

Un besoin d’expertise au service d’une régulation adaptée

En matière audiovisuelle, l’ambition politique, énoncée dans la directive SMA, de modifier les règles du marché en orientant les usagers vers certains types de contenus par des processus de « mise en valeur », s’est concrétisée en France, dans le décret du 22 juin 2021 relatif aux services de médias audiovisuels à la demande. Le régulateur s’est engagé, par choix politique, à la mise en avant de contenus européens sur la page d’accueil de chaque usager, indépendamment de ses préférences propres. L’articulation entre la volonté politique de promouvoir certains types de contenus et la personnalisation des algorithmes de recommandation notamment dans un souci de diversité culturelle, est cependant loin d’être simple dans la mesure où chaque page d’accueil est différente d’un usager à l’autre. Etablir des outils de régulation adaptés à l’environnement des services à la demande suppose des méthodes d’expertise appropriées et des outils d’objectivation afin de confirmer ou d’atténuer les craintes exprimées.

Les expériences menées au sein de la Chaire participent, de manière exploratoire, de cette démarche d’objectivation. Notre méthodologie, a en effet fourni des informations quantitatives sur la mise en avant des contenus dans le cadre d'une page d'accueil générée par un algorithme. La question posée était de savoir dans quelle mesure les contenus mis en avant sur la page d’accueil d’un service de SVOD étaient diversifiés. Au terme des expériences menées, il apparait que la recommandation algorithmique testée ne constitue pas, à ce stade, une « menace » pour la diversité culturelle. Il reste cependant important de poursuivre ce travail dans au moins trois directions.

Pérenniser une preuve de concept

L’importante phase de développement réalisée au sein de la Chaire a permis de valider une preuve de concept qu’il serait désormais pertinent de pérenniser. Le monde académique dans son ensemble, est sans aucun doute, amené à approfondir une expertise pluridisciplinaire, à la fois technique et sociale, sur les mécanismes de sélection des informations recommandées et à collaborer avec les instances de régulation.

Étudier les systèmes de recommandation d’autres services et dans d’autres pays

L’arrivée imminente de nouveaux services de vidéo-à-la-demande dans le paysage audiovisuel hexagonal conforte le besoin d’expertise au-delà du cas Netflix sur lequel nous nous sommes concentrés. Tous les dispositifs de recommandation ne se valent pas et une comparaison des effets de chacun sur les contenus mis en avant serait bienvenue. De plus, les services en ligne étant potentiellement des outils importants de soft power pour la circulation de la culture européenne dans le monde, reproduire de telles expérimentations hors de France serait également utile.

Lever le voile sur une grande inconnue, l’effet de la recommandation sur le comportement réel des usagers

Les expériences menées s’intéressent à la capacité des dispositifs de recommandation à visibiliser certains contenus plus que d’autres. Elles ne fournissent pas de réponses concernant les comportements réels des usagers. Les dispositifs de recommandation mettent en avant certains contenus plus que d’autres, mais ils ne présagent pas des comportements réels des usagers face à de tels dispositifs et n’influencent pas automatiquement la demande. La recommandation reste une forme d’incitation – non contraignante - à choisir certains contenus plutôt que d’autres ; elle ne condamne pas l’usager à être automatiquement piégé, dans sa consommation effective, par ces dispositifs. Les usages de la recommandation restent un point mal documenté – en dehors de la connaissance fine qu’en ont les services eux -mêmes en interne - et l’écart entre la mise en avant et la consommation réelle pourrait faire l’objet d’autre travaux.

Notes

↑
Bideau (2022). A method for measuring content prominence on Netflix. Accessible en ligne.
↑
Bideau & Tallec (2022). Algorithmic panic: European contents on the Netflix homepage. Accessible en ligne.
↑
Bideau, Tallec & Hong (2022). Does Netflix's recommender system promote Korean and Japanese content? Accessible en ligne.