Du patrimoine éditorial à la base de connaissance : vers une nouvelle ère de l’information

L’intelligence artificielle (IA) révolutionne les méthodes de communication, simplifie l’analyse et la production de contenus, tout en posant des questions cruciales sur la fiabilité de l’information. Dans ce contexte, comment garantir une qualité et une pertinence optimales des contenus que nous produisons ?

Les IA génératives, comme les modèles de langage de grande ampleur (LLM), s’appuient sur des bases de données ouvertes, issues du web. Mais la véracité des informations générées reste problématique : sont-elles le reflet d’une répétition massive par diverses sources ? Proviennent-elles de sites dotés d’une autorité numérique pertinente ? Dans les deux cas, cela n’en fait pas nécessairement une information vérifiée et fiable.

Ainsi, pour une marque, dont la prise de parole s’appuie sur des thématiques stratégiques, le web est une ressource insuffisante et non pertinente avec des données difficilement vérifiables. Il est pourtant difficile aujourd’hui de se passer des IA génératives. Le patrimoine éditorial comme base de connaissances propriétaires paraît d’autant plus essentiel.

Le patrimoine éditorial : un actif stratégique

En donnant accès à des outils rapides de génération de contenu, nous prenons le risque de provoquer une forme de paresse dans les équipes. Capter les informations, en déterminer l’intérêt, les stocker et se poser la question d’une exploitation optimisée… Tout cela réclame de s’interroger sur l’intérêt de récupérer ou de développer le patrimoine éditorial d’une marque, mais aussi celui de conserver le savoir-faire et de préserver les connaissances des collaborateurs qui quittent l’entreprise.

Or, ces tâches, qui pourraient paraître fastidieuses ou sans valeur ajoutée immédiate, sont aujourd’hui primordiales pour construire ou développer ce patrimoine et alimenter la base de connaissance de la marque. Celle-ci devient un élément clé pour concevoir des IA spécialisées capables de fournir des informations fiables et adaptées à des domaines spécifiques.

Centralisation et transversalité de l’information : « le content hub »

Si les Digital Asset Management (DAM) et Product Information Management (PIM) ont modernisé la gestion des contenus en centralisant des actifs numériques et des données produit, ces outils restent statiques, se concentrant sur la structuration. Et toutes les entreprises n’ont pas encore totalement accompli cette mutation.

Pour basculer dans un environnement dynamique et évolutif, il est temps de se familiariser avec le RAG (retrieval-augmented generation — à lire les définitions d’AWS et d’Oracle). En intégrant des données internes et vérifiées dans un espace de récupération spécifique, les outils RAG permettent de produire des réponses ou des contenus fondés sur des informations fiables et contextuelles. Contrairement aux approches classiques, le RAG-LLM peut adapter les contenus en fonction des besoins spécifiques, tout en garantissant la provenance des informations. En d’autres termes, le croisement de ces solutions permet de centraliser, d’organiser et de rendre accessibles toutes les données et contenus stratégiques d’une entreprise : le fameux « content hub ».

Source : towards data science

Des bénéfices immédiats et multiples du RAG

Parmi les nombreux avantages, l’introduction du principe du RAG a des vertus multiples pour les directions de communication et marketing :

  • Un patrimoine éditorial exploitable : les contenus passés, souvent sous-exploités, deviennent une ressource précieuse pour alimenter les futures productions.
  • Un gain en qualité et en fiabilité : les données vérifiées intégrées dans la base de connaissances garantissent une production alignée sur les standards de rigueur des marques.
  • Une exploitation optimisée de l’information : toutes les informations captées et inexploitées (interviews, comptes rendus, conférences…) contribuent au capital informationnel de l’entreprise.
  • Une meilleure gestion des savoirs : en centralisant les expertises et les connaissances, les entreprises protègent leur patrimoine intellectuel (au départ de certains collaborateurs) et optimisent leur transmission interne (programmes de formation).

À ce propos, la BPI a publié un dossier complet en décembre dernier sur les principes du RAG et sur les conditions de son adoption dans les entreprises.

De nouveaux enjeux métiers pour la communication

Au-delà de la technicité et du coût de la mise en place d’un tel dispositif, c’est dans les process métiers que l’impact paraît le plus important. En effet, le renouveau de ce que nous appelions il y a quelques années le « dossier source » réclame de s’interroger sur les rôles et responsabilités des membres de l’équipe communication au sens large (les contributeurs externes y compris). La valeur n’est plus forcément dans la production sous différents formats d’un contenu (article long, synthèse, post social media, etc.), mais plutôt dans la qualité de l’information, dans sa singularité et dans la tonalité de l’expression de la marque.

Ainsi, il s’agit donc de se concentrer sur :

  • La nature de l’information,
  • Son intérêt pour l’entreprise et les audiences,
  • Sa qualité patrimoniale,
  • Les thématiques prioritaires pour engager les différents publics.

Dès lors, l’utilisation du RAG bouscule donc le workflow de l’information et nécessite une vigilance accrue. La centralisation des données doit respecter des normes strictes en matière de fiabilité, d’éthique, de confidentialité et de parcours de l’information. La mise en place d’une base de connaissance impose une alimentation régulière avec de nouvelles informations, une centralisation de ces informations dans un seul et même espace, ainsi que le développement de nouveaux réflexes pour les équipes qui produisent les contenus, quelle qu’en soit la forme.

Pour conclure, au-delà des performances techniques, l’intelligence artificielle participe à redéfinir la manière dont les entreprises doivent gérer leurs contenus et leurs connaissances, et exploiter leur patrimoine éditorial. Cela ne peut se faire sans le développement de compétences hybrides pour que leurs collaborateurs deviennent des experts dans l’utilisation et l’interprétation des outils IA.