La production automatisée d’informations en appui aux pratiques journalistiques

1 mai 2020

Présentation de soutenance publique de thèse, le 30 avril 2020, sous la direction de David Domingo et Seth van Hooland. Membres du jury : Juliette De Maeyer (Université de Montréal), Sylvain Parasie (Sciences Po Paris), Sébastien De Valériola (ULB), Florence Le Cam (ULB). Présidente du jury : Pascaline Merten.

 

soutenance_these

 

1) Introduction

La métaphore du « robot journaliste » est régulièrement utilisée pour désigner des processus automatisés de production d’actualités journalistiques. Leur particularité est de transformer des données structurées en textes, en graphiques ou en toute autre forme de représentation visuelle. Le texte que vous avez sous les yeux a été généré de manière automatique à partir de gabarits de textes qui ont été préparés par des journalistes du service « Investir » du quotidien L’Echo, en s’appuyant sur des données financières fournies par VWD, une société allemande spécialisée dans la vente de données. L’objectif de cette démarche est de faire gagner du temps aux journalistes dans la couverture en temps réel des marchés boursiers. Selon leurs estimations, ce gain de temps serait d’une demi-heure par jour et par journaliste. Si cela peut vous paraître peu, cela n’est pas négligeable compte tenu du travail intense que cette couverture médiatique suppose.

 

2) Pour quel projet éditorial ?

La prise en charge de tâches répétitives et chronophages est l’un des principaux arguments régulièrement mis en avant pour justifier l’introduction de systèmes d’automatisation dans les rédactions. Ces systèmes sont régulièrement salués pour leurs qualités de vitesse et de précision. Ils permettent de produire des contenus standardisés et à grande échelle. Ils peuvent relever d’une logique de personnalisation, dans le cadre de stratégies de segmentation des audiences, ou s’inscrire dans une perspective servicielle, par exemple pour fournir les résultats d’élections en fonction de la région du lecteur. Ils sont également utilisés pour élargir les zones de couverture médiatiques, par exemple pour des résultats de rencontres sportives qui n’étaient pas ou peu couvertes jusque-là. Les productions automatisées peuvent être délivrées telles quelles aux audiences, mais elles peuvent aussi servir de brouillons que les journalistes vont enrichir de leur expertise. C’est ce second versant de l’automatisation que j’ai exploré dans cette thèse, c’est à dire lorsque les technologies d’automatisation sont conçues en tant qu’outils du journalisme, pour soutenir un travail qui s’inscrit dans le temps long de l’enquête, ou dans l’immédiateté des routines quotidiennes.

 

3) Au cœur de cette recherche

Plus particulièrement, je me suis intéressée à la manière dont ces artefacts pouvaient s’intégrer dans les pratiques journalistiques. Considérant que l’on ne peut faire usage d’une technologie sans se la représenter, je me suis interrogée sur l’influence des représentations de ces technologies dans la structuration des usages. Ma première hypothèse était que la métaphore du robot journaliste serait une source de résistance, en raison des remises en question professionnelles et identitaires qu’elle peut induire. Ma deuxième hypothèse considérait que les usages journalistiques dépendraient de l’adéquation des productions automatisées avec les savoir-faire et les exigences du journalisme. Ces deux hypothèses ont été explorées en deux temps : dans une première partie, consacrée à l’analyse des représentations sociales et des pratiques culturelles en lien avec l’automatisation de la production d’informations ; et dans une seconde partie dédiée à deux études de cas menées dans les rédactions du mensuel Alter Échos et du quotidien L’Echo.

 

4) Une approche ethnographique embarquée

Dans cette recherche, j’ai assisté de manière privilégiée à la naissance du phénomène en Belgique francophone. A l’époque où j’ai débuté mes travaux, il n’existait d’ailleurs aucune rédaction engagée dans ce type de projet. C’est la raison qui m’a poussée à créer un objet d’étude original, où j’ai mis mes compétences professionnelles au service de cette recherche. Il s’agissait du « Bxl’air bot », qui consistait en une plateforme automatisée en ligne qui agrégeait et traitait de données relatives à la qualité de l’air en région bruxelloise. Je l’ai proposée à la rédaction du mensuel Alter Echos, en vue d’observer les comportements des journalistes : allaient-ils se servir ou non de l’outil, et pour quelles raisons ? Dans la deuxième étude de cas, j’ai assuré une mission de consultance pour le quotidien L’Echo, dans le cadre du développement de « Quotebot », que je vous ai introduit au début de cette présentation. Mon rôle était d’accompagner les journalistes dans le développement d’un système qu’ils allaient définir en amont de son développement technique. Il consistait également à évaluer les productions automatisées, ainsi que la manière dont les journalistes percevaient le système d’automatisation.

 

5) Un important matériel de recherche

Mon implication active dans ces deux expériences a nécessité une recherche constante d’un équilibre entre mon engagement sur le terrain et la nécessaire mise à distance critique des observations réalisées et de leur analyse. Mais cela m’a donné accès à un important matériel de recherche auquel je n’aurais pas pu accéder autrement. Outre des enquêtes par formulaire, des entretiens semi-dirigés, et des observations participantes à des réunions de rédaction ou à des réunions de travail, mon matériel de recherche comprend également de nombreux échanges de courriels ainsi qu’un accès à un certain volume de documents de travail hébergés sur une plateforme collaborative en ligne. Mon propos était de faire varier l’angle d’observation pour enrichir l’analyse, dans une démarche soutenue par un cadre théorique transdisciplinaire. Des méthodes particulières de recherche ont été mobilisées dans chaque étude de cas, tenant compte de leurs spécificités, avec d’une part, une évaluation de la qualité des données publiques utilisées dans « Bxl’air bot », pour répondre au double challenge technique et journalistique que constitue un projet d’automatisation ; et d’autre part, des évaluations orientées sur l’expérience utilisateur, un concept relatif à la notion de plaisir dans l’usage.

 

6) Deux terrains de recherche complémentaires

Dans la première rédaction étudiée, les journalistes travaillent dans une petite structure associative et sont peu portés sur les outils technologiques ainsi que sur une approche générale par données. L’expérience y a duré un an, une année au terme de laquelle les données de « Bxl’air bot » ont été traitées dans le cadre d’un dossier sur la qualité de l’air. Car si elles donnent à voir un état de fait à instant T, les données ne disent rien sur les causes et sur les conséquences de la pollution atmosphérique. Les cinq journalistes de la rédaction étaient concernés par cette expérience, de même qu’une journaliste indépendante spécialisée dans les questions relatives à la qualité de l’air. Deux journalistes se sont impliquées dans la conception du système d’information, pour lequel le seul budget mis à disposition fut celui de l’achat d’un serveur web pour héberger la plateforme.

Dans la seconde expérience, le groupe social étudié est celui des journalistes du service « Investir » de L’Echo, qui est l’un des deux quotidiens édités par le groupe de presse Mediafin. Les journalistes y sont habitués à jongler avec les chiffres et considèrent les technologies numériques comme des outils qui appuient leur travail quotidien. Trois journalistes se sont impliqués de manière régulière dans la conception de « Quotebot », dont le développement a été pris en charge par une start-up française spécialisée dans les technologies sémantiques. Il s’agit d’un projet financé par le Google Digital News Initiative, pour un montant d’un peu plus de 211.000 euros. Le projet devait durer initialement un an mais, à l’époque de clôturer ma thèse, il n’était pas encore terminé. Avec un peu plus d’une année de retard dans le calendrier, « Quotebot » devrait enfin voir le jour cet été.

La complémentarité de ces deux terrains de recherche va se refléter dans les observations qui ont été réalisées.

 

7) Imaginaires technologiques : Bxl’air bot

En ce qui concerne les imaginaires technologiques de la rédaction d’Alter Échos, ceux-ci sont façonnés par un idéal journalistique qui privilégie l’écrit et le terrain, la plupart des journalistes définissent d’ailleurs leur démarche comme « traditionnelle ». S’ils ne rejettent pas la technologie en bloc, ils la trouvent contraignante et chronophage, notamment parce qu’elle nécessite du temps pour son apprentissage et sa mise en pratique. Leur relation aux données est aussi duale : si elle est appréhendée comme une pratique journalistique qui suscite la curiosité de certains, d’autres estiment que les chiffres font peur. Dans cette expérience, la métaphore du robot va jouer un rôle ambivalent. A la fois outil de communication, qui donne une image positive d’un média qui innove ; et outil de dédramatisation face à un phénomène pouvant être perçu comme une menace. Certains journalistes ont indiqué percevoir cette menace, et cette perception n’a pas évolué. Mais ce qui a pu changer, au fil des mois, se trouve dans le rapport à l’outil : après la publication d’articles intégrant les productions de « Bxl’air bot », celui-ci a finalement été perçu comme une source d’informations pouvant nourrir utilement le journalisme.

 

8) Imaginaire technologique : Quotebot

En ce qui concerne les journalistes du service « Investir » de L’Echo, les technologies numériques sont des outils bien intégrés dans leurs pratiques professionnelles. Le projet « Quotebot » a d’emblée suscité leur enthousiasme, les journalistes percevant l’avantage relatif de l’innovation, qui est celui de la prise en charge de tâches répétitives qui leur feront gagner du temps. Toutefois, la métaphore du robot, qui sera d’ailleurs très peu utilisée, va inciter à la prudence en termes de communication à l’ensemble de la rédaction, en vue de ne pas donner trop d’importance à un dispositif développé pour un service en particulier. La concurrence perçue sera éventuellement celle de la société en charge du développement de « Quotebot » : « C’est eux qui vont nous remplacer ? », demandera un journaliste sur le ton de la boutade lors d’une réunion de travail. Un éventuel rapport affectif va également émerger, dans la mesure où les productions automatisées vont renfermer une petite part des journalistes, puisque ce sont eux qui ont défini les gabarits de textes à automatiser.

 

9) L’ambivalence de la métaphore du robot

Si l’on considère la première hypothèse de recherche, la dualité représentationnelle véhiculée par la métaphore du robot peut contribuer à forger les usages mais aussi les non-usages, bien qu’elle n’apparaisse pas comme un élément déterminant dans ces deux projets. Elle n’est d’ailleurs pas la seule variable représentationnelle participant à la structuration des usages. Dans les deux cas, on va assister à un usage d’adoption symbolique, qui se rapporte à l’acceptation de l’idée de l’innovation, et qui va essentiellement se situer à un niveau discursif. On assistera également à une logique d’usage d’évaluation qui dépend des représentations de la technologie. Par exemple, lorsque les journalistes de L’Echo estiment que « Quotebot » leur fera gagner du temps ; ou lorsque des journalistes d’Alter Echos estiment que « Bxl’air bot » est une source d’informations qui s’ajoute à un arsenal existant. Mais dans la rédaction d’Alter Echos, les usages n’ont pas été réalisés par quatre des journalistes sur les six impliqués dans ce projet.  Cela peut s’expliquer par une relation difficile avec les technologies numériques et/ou avec des chiffres « qui font peur », bien que les journalistes aient admis percevoir l’intérêt du dispositif.

Un désintérêt envers la thématique de la qualité de l’air peut également expliquer ces non-usages. Ces différentes considérations d’ordre représentationnel trouvent un prolongement lorsque l’on s’intéresse à l’adéquation des productions automatisées avec les savoir-faire et les exigences du journalisme.

 

10)  Exigences professionnelles : Bxl’air bot

Dans l’expérience « Bxl’air bot », la précision des données constituait un préalable à leur automatisation, pour rencontrer des exigences journalistiques de fiabilité et de précision. Mais pour y parvenir, un monitoring humain a été nécessaire tout au long de l’expérience. En effet, il s’agissait ici de données publiques diffusées sur des pages web, dont le format mouvant présentait de potentiels problèmes de qualité. Cette activité, que j’ai prise en charge, est restée invisible pour les journalistes, bien qu’il ait été considéré comme « important » le fait qu’un humain se trouve derrière l’application automatisée. Mon expérience professionnelle en journalisme, a pu garantir, aux yeux d’une journaliste, que les fondamentaux du métier aient été respectés. L’expérience a également montré qu’il est difficile de se projeter dans des usages finaux dans le contexte d’un journalisme au long cours. Tous les cas de figure n’ont pas pu être envisagés au début de l’expérience, et les besoins se sont davantage précisés lors de la préparation des articles destinés à être publiés. L’une des principales difficultés consistait à partir de données pour dégager un angle journalistique, alors qu’habituellement, la démarche s’opère en sens inverse.

 

11) Exigences professionnelles : Quotebot

Les exigences posées par les journalistes du service « Investir » de L’Echo ont été définies au cours de réunions de travail préparatoires, dont l’objet était de fournir un maximum d’indications sur les résultats attendus, en vue d’une traduction technologique qui soit conforme à leurs demandes. Les exigences de fiabilité et de précision des données ont mis en lumière des problèmes de qualité, liés à la nature du contrat avec le fournisseur de données qui ne permettait pas, dans tous les cas, d’en disposer en temps réel. Il s’agit d’un problème qui n’était pas attendu. De plus, si l’expertise du domaine d’application était garantie par les journalistes, celle-ci n’était pas forcément partagée avec le prestataire de services.

Cela a également conduit à des productions dont la qualité n’a pas été jugée satisfaisante par certains journalistes. Malgré leur implication dans le processus de conception et de correction du moteur de rédaction, les journalistes ont estimé que « Quotebot » n’écrivait pas comme eux. Dans cette expérience, où les parties prenantes étaient issues des mondes du journalisme et de la technique, un agent de médiation a assuré un rôle de courroie de transmission qui revêtait également une forte dimension pédagogique. Il s’agit du manager des médias numériques de L’Echo, dont le profil hybride a permis de comprendre les besoins de chacune des parties prenantes et de favoriser le dialogue.

 

12) Adéquation aux exigences journalistiques

Si l’on considère la seconde hypothèse de recherche, celle-ci apparaît comme déterminante. Deux préalables apparaissent dans la perspective d’usages finaux : en premier lieu, la fiabilité et la précision des données et, en second lieu, une expertise éditoriale, qui est aussi relative à une expertise du domaine d’application, qui doit être partagée entre les agents sociaux des mondes du journalisme et de la technique. Sur un plan professionnel, cela va impliquer une reconfiguration des pratiques tantôt liées aux particularités d’une approche par données dans le journalisme, tantôt liées à la logique d’un processus impliquant que les journalistes soient amenés à déconstruire leur manière d’écrire en vue de la standardiser. Dans les deux cas, le sens donné aux productions automatisées sera celui de la médiation journalistique.

 

13) Entre appropriation et résistances

Dans l’expérience « Bxl’air bot », des usages d’appropriation ont été partiellement réalisés. Bien qu’une journaliste ait intégré les productions de « Bxl’air bot » dans ses articles, elle a conservé une mise à distance face à un dispositif qui était non sollicité par la rédaction, mais elle en a aussi assumé la part de subjectivité qui était induite par les choix journalistiques posés lors de la conception du dispositif. Plusieurs logiques d’usage ont également été observées dans les deux études de cas : une logique utilitaire, lorsque la coordinatrice du magazine Alter Échos consulte l’application en ligne en vue de préparer un dossier thématique ;  une logique identitaire, en adéquation (ou non) avec l’individu, lorsque les journalistes de L’Echo, estiment que « Quotebot » n’écrit pas comme eux ; et une logique de médiation, où l’usage va être facilité par l’intervention d’un tiers : dans ces deux études de cas, les agents de médiation sociotechnique vont jouer un rôle pédagogique en expliquant le dispositif. Dans le projet « Quotebot », les résistances observées sont liées au manque d’adéquation des productions automatisées avec les exigences journalistiques. Elles sont aussi liées à la charge de travail supplémentaire que le processus de correction a nécessité. Cela a conduit un journaliste à remettre en question l’organisation et son management, et cela a également contribué à ralentir le projet.

 

13) Conclusion et mise en perspective

Nous pouvons retenir de ces deux expériences que l’inclusion des journalistes dans le processus de conception permet de faciliter les usages mais sans les garantir. Un autre point de convergence est à trouver dans une exigence du respect des fondamentaux du journalisme, dans le cadre d’un partenariat où le journaliste conserve le monopole de la mise en sens. Cette posture permet d’affirmer la valeur ajoutée du journaliste, sans remettre en question ses spécificités. Par ailleurs, le positionnement discursif des journalistes peut évoluer dans le temps, au fur et à mesure de la découverte des possibilités et des limites de l’innovation. Cette recherche corrèle avec les résultats de recherches antérieures relatives à la diffusion d’innovations technologiques dans les rédactions. Elle souligne le rapport difficile que les journalistes peuvent avoir avec les chiffres, et elle met en relief des mécanismes de résistance qui avaient déjà été observés par ailleurs. Cette recherche témoigne également du façonnage mutuel entre social et technique. Ce qui est neuf, ici, se rapporte aux imaginaires technologiques portés par la métaphore du robot, lesquels vont essentiellement se jouer sur un plan discursif.

Les apports de cette recherche sont ceux d’avoir pu suivre de l’intérieur le processus de construction sociotechnique d’un phénomène naissant en Belgique francophone, et d’avoir développé des méthodes d’évaluation inspirées par les sciences et technologies de l’information et de la communication, des méthodes susceptibles d’être reproduites ultérieurement. Il est aussi celui d’avoir pu mettre en lumière le rôle de nouveaux acteurs du monde de l’information qui, bien qu’ils se défendent faire acte de journalisme, participent activement à la chaîne de production de l’information.

 

# #