Les modèles actuels (LLM) imitent de plus en plus les humains dans leur manière de rédiger. Les outils de détection IA perdent également en capacité prédictive, et ne peuvent plus, à eux seuls, démontrer qu'un texte a été produit par une IA.
La rédaction par une IA est-elle vraiment un problème ? Prenons l'exemple de l'industrie vestimentaire : un vêtement de haute qualité plaît par sa coupe et sa durabilité, qu'il ait été cousu main par un artisan ou assemblé par des machines de précision. L'important ici est que les coutures tiennent, et que le résultat serve pertinemment la personne qui va le porter. Il faut mieux une excellente couture cousue mécaniquement qu'une très bonne couture faite main.
De la même manière, un texte est bon s'il est juste, utile et conforme, qu'il soit issu d'un cerveau humain ou d'un algorithme.
Le risque dans une organisation ne réside pas dans l'usage de l'IA.
Il repose dans l'absence de validation humaine : un texte généré automatiquement et non relu est un actif fragile, susceptible de contenir des hallucinations factuelles ou des imprécisions qui continuent d'engager sa responsabilité juridique. Pour la simple et bonne raison que les IA sont des robots, et donc des choses, et ne sont pas responsables de ce qu'elles font.
Dans cet article, nous allons présenter de manière conjointe le fonctionnement des LLM et les indices que ces derniers laissent dans les textes.
1. La densité informationnelle contre la "moyenne" probabiliste
Le symptôme le plus frappant est la tendance de l'IA à viser une moyennisation de la pensée, à partir de ses données d'entraînement.
- Le symptôme IA : Le texte est lisse, sans aspérité. Il évite systématiquement les prises de position tranchées non sourcées et abuse de mots de liaison standards ("En outre", "Par ailleurs", "Il est important de noter"). C'est une reformulation parfaite de consensus, sans valeur ajoutée.
- La marque humaine : Présence d'idées "hors distribution". L'humain fait des sauts logiques, utilise des métaphores inédites issues de son vécu, ou accepte de laisser une zone d'ombre plutôt que de combler avec du remplissage.
- Le test : Demandez-vous : "Cette phrase apporte-t-elle une information nouvelle ou reformule-t-elle un savoir commun ?" Si c'est une reformulation fluide mais vide, c'est suspect.
2. La gestion de l'erreur et de l'incertitude
La manière d'assumer le doute est un marqueur puissant de l'origine du texte.
- Le symptôme IA : L'IA hallucine, c'est-à-dire qu'elle invente des informations, de manière péremptoire ou, à l'inverse, se réfugie dans une prudence générique ("Il est complexe de dire..."). Quand elle admet une limite, c'est de manière standardisée. Elle a du mal à maintenir une tension entre deux vérités contradictoires sans chercher à les réconcilier artificiellement.
- La marque humaine : L'expert humain peut exprimer des incertitudes, de manière précise, ou même suggestive. Il cite ses sources de manière contextuelle, parfois imparfaite, et admet ses biais.
- Le point de vigilance : L'absence de nuances "grises", de sous-entendus ou de rappels implicites à des informations partagées par une expérience subjective entre individus.
3. La structure argumentative linéaire ou arborescente
La géométrie du texte trahit souvent son auteur.
- Le symptôme IA : Les paragraphes ont souvent une longueur similaire, créant une architecture "optimisée" pour la lisibilité moyenne (mais un peu fadasse).
- La marque humaine : Une structure organique. Un point crucial peut prendre 10 lignes, un autre 2 paragraphes. L'argumentation peut revenir en arrière, faire une digression pertinente, ou changer de ton selon l'émotion du sujet.
- L'indice technique : Analysez la variance de la longueur des phrases. Une trop grande régularité est un marqueur algorithmique.
4. La référence au contexte temporel et spatial précis
L'ancrage dans le réel est le talon d'Achille des modèles génératifs.
- Le symptôme IA : Utilisation d'exemples génériques ou datés (souvent coupés à la date d'entraînement). Même avec accès au web, elle tend à généraliser ("De nombreuses entreprises..."). Pour les professionnels du droit, les IA peuvent inventer des décisions de jurisprudence, à moins de se connecter avec des MCP (prises universelles) aux données de Legifrance.
- La marque humaine : Citation d'un événement très récent, d'une anecdote locale, d'une spécificité réglementaire de dernière minute, ou d'un détail "inutile" narrativement mais vrai contextuellement.
- Le test : Vérifiez les références précises. Ou utilisez (à votre propre risque) des plugins de contre-vérification de votre LLM.
5. L'anglicisation structurelle
C'est le marqueur linguistique le plus insidieux. Les grands modèles étant majoritairement entraînés sur des corpus anglais, ils imposent une structure profonde anglo-saxonne au français. Le ministère de la Culture a d'ailleurs lancé l'outil Comparia pour lutter contre ce biais et évaluer la "francité" des réponses des IA.
Voici cinq patterns révélateurs, un par phénomène :
- La place de l'adjectif : L'IA place souvent l'adjectif avant le nom (calque de an important decision).
- Phrase suspecte : « Une large variété de sérieuses difficultés. » (Un francophone dirait : « Une variété étendue de difficultés majeures. »)
- La nominalisation excessive : L'IA empile les noms (calque du Business English).
- Phrase suspecte : « La mise en œuvre de la vérification de la conformité. » (plutôt que « Vérifier la conformité. »)
- Le passif systématique : L'IA efface le sujet (calque de it has been decided).
- Phrase suspecte : « Il a été décidé que des mesures ont été prises. » (plutôt que « Le comité a décidé de prendre des mesures. »)
- Le gérondif en tête de phrase : L'IA traduit littéralement les -ing forms.
- Phrase suspecte : « Ayant analysé les données, une stratégie fut adoptée. » (« Après avoir analysé les données, nous avons décidé de... »)
- La répétition mécanique des connecteurs : L'IA structure tout par des adverbes en début de phrase.
- Phrase suspecte : « De plus... Cependant... En outre... Par conséquent... » (Un humain varierait les structures ou utiliserait la ponctuation).
Conclusion : Vers une validation hybride
Aucun signal isolé n'est une preuve absolue. C'est la convergence de ces indices, à savoir le lissage, la structure rigide, l'absence de risque, la généralisation et les calques syntaxiques anglais, qui doit alerter.
L'IA est un accélérateur de production formidable, mais dans des domaines sensibles comme le droit ou la stratégie, elle ne peut se passer d'une expertise humaine.
Votre contenu stratégique engage votre responsabilité. Qu'il soit cousu main ou par la machine, assurez-vous simplement que les coutures tiennent.