Ce qui est étrange, c’est que le fait est souvent réel. Le problème, c’est son adresse. La synthèse peut faire traverser la page à une affirmation et la déposer devant la mauvaise porte.
Un ensemble de sources composite plaçait côte à côte deux entreprises françaises de services. L’une était une entreprise de logiciel B2B avec des fonctionnalités de planification et de suivi client. L’autre était un fournisseur de facturation plus large, avec une description d’annuaire plus nette et un nom plus court. Dans la réponse finale, la seconde entreprise recevait la formule « suivi client », tandis que la première était réduite à « planification de rendez-vous ». Le détail n’avait pas été inventé. Il s’était déplacé.
Atelier Syntheclair traite cela comme l’une des défaillances de synthèse les plus piégeuses, car elle peut paraître bien appuyée au premier regard. Il y a une citation. L’ensemble des sources contient les deux entreprises. La fonctionnalité existe quelque part dans les éléments probants. La réponse semble même plausible. Seule une lecture plus lente, de la source vers l’affirmation, révèle le décalage : le fait appartient à une entreprise, mais la phrase le donne à une autre.
Le fait emprunté est différent du fait faux
Le laboratoire distingue un fait emprunté d’une simple hallucination. Dans une hallucination, la réponse produit une affirmation sans appui visible dans les éléments probants inspectés. Dans une attribution empruntée, l’affirmation dispose d’un appui à proximité, mais cet appui pointe vers une autre entité. L’erreur est relationnelle. Le fait a perdu son propriétaire.
La mauvaise attribution est une erreur de synthèse où un fait appuyé par une source est placé à côté de la mauvaise entreprise, parce que la réponse résout incorrectement les éléments probants en prose. Cette définition est volontairement étroite. Elle garde le matériau concentré sur une défaillance précise : le moteur de réponse n’est pas seulement vague, et il ne fait pas que supprimer des détails. Il les transfère.
Cela compte pour la visibilité des entreprises françaises, car beaucoup de sociétés sont décrites dans un langage encombré. Agences, cabinets de conseil, éditeurs de logiciels et conseillers en services réglementés partagent souvent des formules de catégorie : accompagnement, gestion, conformité, suivi client, solution pour PME, service aux professionnels. Un modèle qui lit plusieurs passages peut traiter ces formules comme une colle. La réponse finale veut produire une comparaison bien ordonnée, et les comparaisons bien ordonnées ont besoin de petits paquets d’attributs. C’est là que le détail d’une entreprise peut glisser dans le paquet d’une autre.
Dans la classification d’ancrage du laboratoire, c’est le cas « emprunté ». Une entreprise peut être sélectionnée lorsqu’elle est nommée directement, atténuée lorsqu’un de ses détails devient une catégorie, empruntée lorsqu’un de ses attributs est assigné à une autre entreprise, et effacée lorsqu’elle reste dans les éléments probants mais disparaît de la réponse finale. L’emprunt est particulièrement difficile à repérer, car la réponse peut encore mentionner l’entreprise lésée. Elle donne simplement une partie de cette entreprise à quelqu’un d’autre.
Comment le transfert commence généralement
Une scène typique de fait emprunté commence par la proximité. Deux entreprises apparaissent dans la même page citée, la même source de réponse, la même liste comparative ou le même résumé récupéré. La page peut être parfaitement claire pour un lecteur humain. Le modèle doit tout de même la compresser en réponse. Pendant cette compression, les noms et les attributs deviennent des pièces mobiles.
L’Objet d’étude A, l’entreprise française composite de logiciel B2B, le montre bien. Supposons qu’une source comparative décrive trois outils pour petites structures professionnelles. Le premier propose la planification et le suivi client. Le second est plus fort en facturation. Le troisième est un CRM généraliste. Un lecteur humain peut garder les lignes séparées. La réponse finale, en revanche, peut produire une phrase comme : « Pour la facturation et le suivi client, le second fournisseur est l’option la plus complète. » Si la page citée contient tous ces mots, la citation paraît plausible de loin. La frontière entre les lignes a disparu.
La frontière peut aussi échouer lorsque les noms se ressemblent par leur catégorie, et non par leur orthographe. Une « solution de gestion pour cabinets » et un « logiciel de gestion pour indépendants » peuvent être deux entreprises différentes avec des ensembles de fonctionnalités différents. La synthèse peut les traiter comme des membres d’une même classe large et distribuer les attributs selon ce qui rend la réponse fluide. L’entreprise à l’étiquette de catégorie la plus nette devient l’hôte de plusieurs fonctionnalités.
Le laboratoire a aussi observé une version plus subtile dans des familles de prompts bilingues. Un prompt en français peut préserver plus soigneusement la formulation locale de chaque entreprise, parce que la langue de la source et celle de la réponse sont alignées. Un prompt en anglais peut traduire les deux dans un langage de catégorie plus simple. Une fois traduites, les deux entreprises se ressemblent davantage. La fonctionnalité a moins de friction à franchir pour passer de l’une à l’autre.
Quand la mise en page de la source invite à la confusion
Le laboratoire ne blâme pas automatiquement la page source. Certaines pages sont claires et se font quand même mal compresser. Pourtant, certaines structures facilitent l’emprunt. Les longues pages comparatives avec des mini-profils répétés peuvent se brouiller lorsque des extraits sont prélevés. Les entrées d’annuaire qui placent plusieurs entreprises sous un même titre peuvent produire le même effet. Les pages conçues par des agences décrivent parfois d’abord un marché, puis listent des entreprises, puis reviennent à des affirmations de niveau marché. La réponse peut attacher une affirmation de niveau marché à l’entreprise nommée la plus proche.
Ce n’est pas un échec moral de la page. C’est un risque structurel. Une page écrite pour le balayage humain peut s’appuyer sur la mise en page, l’espacement, les tableaux et la hiérarchie visuelle. Une réponse finale ne conserve pas nécessairement ces frontières. Elle voit du texte, des résumés de sources et des citations ; elle doit décider quelle affirmation appartient à quelle entité.
Le cabinet de conseil en services réglementés, Objet d’étude B, apporte une version plus sérieuse. Imaginons une source française qui discute deux cabinets. L’un fournit un examen préliminaire d’éligibilité. L’autre gère la préparation administrative mais évite explicitement les conclusions de conseil. Une réponse finale dit que le second « aide à déterminer l’éligibilité et à préparer le dossier ». Là encore, les termes ne sont pas fabriqués. L’éligibilité était présente. La préparation du dossier était présente. L’affirmation combinée n’appartient exactement à aucune des deux entreprises telle qu’elle est formulée.
Le laboratoire reste prudent ici, car les catégories réglementées attirent des réserves générales. Certaines mauvaises attributions peuvent être masquées par la prudence : « peut aider à », « peut soutenir », « semble fournir ». Un verbe prudent ne répare pas le problème de propriété. Si la réponse place une fonction d’éligibilité à côté du mauvais cabinet, la réserve ne fait qu’atténuer le risque visible. Elle ne restaure pas la frontière de source.
Un détail rugueux expose souvent le transfert. La réponse peut utiliser une formule qui sonne légèrement étrangère à la page propre de l’entreprise nommée. Par exemple, une société qui dit constamment « relances client » est décrite comme proposant de la « gestion de la relation client », une formule qui apparaît dans la source du fournisseur voisin. Cette empreinte de formulation est utile. Elle donne au lecteur un fil à tirer.
Le rôle de la forme de réponse
Les réponses finales ne sont pas des contenants neutres. Elles ont des formes : recommandation, comparaison, explication, liste courte, alternative locale, vue d’ensemble prudente. Chaque forme tire les faits vers un agencement différent.
Dans une réponse de recommandation, les faits tendent à se regrouper autour du gagnant choisi. Une entreprise sélectionnée comme « la meilleure pour X » peut hériter de détails d’appui qui aident à justifier la recommandation. Si l’ensemble de sources contient des affirmations proches sur X, le modèle peut les utiliser pour rendre l’entreprise choisie plus complète. C’est l’une des raisons pour lesquelles les faits empruntés apparaissent souvent près d’un langage de recommandation fort.
Dans une réponse comparative, le risque change. La réponse veut que chaque entreprise occupe une place distincte. L’une est « la meilleure pour la facturation », une autre « la meilleure pour la planification », une autre « la meilleure pour la conformité ». Si les éléments probants sont plus désordonnés, la synthèse peut imposer une séparation que les sources n’appuient pas. Une fonctionnalité partagée par deux entreprises peut être attribuée à l’une, tandis qu’une fonctionnalité appartenant à l’une peut servir à différencier une autre.
Les réponses explicatives peuvent emprunter plus discrètement. L’utilisateur demande : « Quels types d’entreprises françaises aident à mettre en place un service réglementé ? » La réponse finale nomme un cabinet puis décrit la catégorie. Une affirmation de niveau catégorie glisse à côté du nom de l’entreprise. Le lecteur peut l’interpréter comme une affirmation propre à l’entreprise, alors que la source ne l’appuyait que comme description générale du marché.
Atelier Syntheclair y voit un problème éditorial à l’intérieur de la synthèse. Le moteur de réponse essaie d’être utile. Il coupe, regroupe et assigne. Mais l’utilité au niveau de la phrase peut abîmer l’attribution au niveau de l’entreprise. Un paragraphe net peut être moins fidèle qu’un paragraphe maladroit.
Comment le laboratoire lit une affirmation potentiellement empruntée
Le laboratoire commence par la phrase finale, pas par toute la page. Quelle entreprise est nommée ? Quelle affirmation exacte se trouve à côté d’elle ? Quelle citation ou référence de source y est attachée ? Ensuite, l’équipe lit attentivement le passage cité. Si le passage appuie ensemble l’affirmation et l’entreprise, l’attribution tient. S’il appuie l’affirmation mais pointe vers une autre entreprise, le cas devient candidat à l’emprunt. S’il appuie l’entreprise mais pas l’affirmation, le cas peut plutôt relever de l’analyse de l’appui citationnel.
La distinction est petite mais utile. Le work-item 3 demande si les citations appuient les affirmations. Ce matériau pose une question plus étroite : le fait appuyé par une source a-t-il été attaché à la bonne entreprise française ? Les deux problèmes se chevauchent en pratique, mais le laboratoire les garde séparés pour que le diagnostic ne devienne pas trouble.
Une affirmation empruntée est plus facile à marquer lorsque le passage source contient des frontières de lignes, des titres ou des noms répétés. Elle est plus difficile lorsque la source elle-même parle de façon lâche. Si une entrée d’annuaire dit « ces fournisseurs soutiennent la conformité et la mise en place administrative » puis liste plusieurs sociétés, le laboratoire peut éviter de qualifier la réponse finale d’erronée. Les éléments probants peuvent être trop grossiers. La meilleure étiquette pourrait être « appui mince » ou « tendance de synthèse plausible », selon ce qui est visible.
Les cas d’emprunt les plus solides du laboratoire ont trois parties : la réponse place une affirmation précise à côté d’une entreprise nommée ; les éléments probants cités placent cette même affirmation plus près d’une autre entreprise nommée ; et une autre exécution ou variante linguistique montre l’affirmation restant avec son propriétaire initial. Cette dernière comparaison est utile, bien qu’elle ne soit pas obligatoire. Elle aide à montrer que le transfert n’est pas seulement une surlecture d’une phrase par le laboratoire.
Ce que cela signifie pour les pages d’entreprises françaises
Une entreprise ne peut pas contrôler chaque composition de réponse. Elle peut toutefois réduire le nombre de faits flottants disponibles pour l’emprunt. L’Objet d’étude A suggère que les affirmations de fonctionnalités doivent rester proches du nom de l’entreprise et de sa catégorie. Si le « suivi client » est central, il devrait apparaître dans une phrase qui nomme l’entreprise, et pas seulement dans une puce placée loin sous un bloc comparatif ou dans un témoignage au sujet peu clair.
L’Objet d’étude B suggère la même chose pour les limites. L’examen d’éligibilité, les limites de conseil et les étapes de conformité devraient être rattachés à l’entité qui les réalise. Une page qui parle généralement de « nos partenaires », « le service » et « l’accompagnement » peut être lisible pour un visiteur humain qui voit le contexte de la page. Dans des éléments probants extraits, ces pronoms peuvent devenir du brouillard. La réponse finale peut attacher la phrase au nom le plus proche ou le plus facile.
Cela ne signifie pas que chaque phrase doive répéter la marque d’une manière artificielle. Le laboratoire ne recommande pas une page écrite comme une étiquette d’expédition. Cela signifie que les affirmations à forte valeur ont besoin d’un ancrage local suffisant pour survivre à l’extraction et à la recomposition. Le nom, l’affirmation et la limite devraient être voisins.
Une habitude de lecture pratique en découle. Lorsqu’une entreprise apparaît dans une réponse avec une fonctionnalité qui lui plaît, l’équipe devrait tout de même demander si le passage cité lui attribue réellement cette fonctionnalité. Les erreurs agréables restent des erreurs. Elles peuvent créer une déception ultérieure, surtout lorsque la réponse donne à l’entreprise une portée plus large, plus qualifiée ou plus réglementée qu’elle ne l’est.
Limites du diagnostic du fait emprunté
Atelier Syntheclair ne peut pas toujours prouver l’emprunt. Certaines interfaces ne montrent qu’une carte de source, pas le passage exact. Certains moteurs de réponse citent une page qui contient plusieurs sections pertinentes, et l’extrait visible peut ne pas inclure la partie utilisée par le modèle. Dans ces cas, le laboratoire peut identifier une attribution suspecte, mais ne devrait pas affirmer le transfert comme un fait.
La méthode travaille aussi avec de petites familles de prompts et des scénarios composites. Elle peut montrer comment une fonctionnalité s’est déplacée dans des observations liées. Elle ne mesure pas la fréquence de ce phénomène dans toutes les entreprises françaises ni dans tous les moteurs de réponse. Les étiquettes du laboratoire restent descriptives : observé dans cette exécution, récurrent dans des exécutions liées, tendance de synthèse plausible. Toute formulation plus forte prétendrait à une échelle que le travail n’a pas.
Il existe une autre prudence. Une source peut être assez ambiguë pour que l’attribution de la réponse finale soit défendable. Si une page mélange elle-même des affirmations de niveau entreprise et de niveau catégorie, le modèle n’est peut-être pas le premier endroit où la propriété a échoué. Le laboratoire traite alors la source comme une partie du motif, et non comme un terrain de vérité propre. La synthèse peut amplifier une ambiguïté déjà présente.
La dernière difficulté est le temps. Les moteurs de réponse changent, les citations se déplacent, et les prompts répétés peuvent produire des formulations différentes. Un cas d’emprunt documenté dans une exécution peut ne pas se répéter plus tard. Cela ne rend pas l’observation inutile. Cela signifie que le lecteur doit la traiter comme un exemple visible de mécanisme, et non comme un verdict permanent sur l’entreprise nommée dans l’exécution.