Vous avez passé des années à construire votre expertise et à documenter vos méthodes. Jusqu’à présent, on vous a toujours conseillé d’offrir, et d’offrir beaucoup, pour pouvoir gagner en crédibilité auprès de nos interlocuteurs.
C’était bien la mise à disposition du contenu qui démontrait votre valeur ajoutée, et permettait à nos prospects d’inférer notre capacité à appréhender leurs problématiques.
L’enjeu est dorénavant plus complexe :
L'accès et la mise à disposition d'informations est beaucoup simple. Il est très facile de produire du texte optimisé SEO pour les moteurs de recherche, et il est très facile d'obtenir une réponse de ChatGPT sur un problème donné.
La seule publication d'un contenu expert ne suffit plus à justifier de l'expertise, puisqu'il est de plus en plus difficile de distinguer ce qui a été rédigé par une IA de ce qui est produit à la main (quoique).
Ne pas optimiser ses publications, c'est se voir cité sans apparaître auprès de vos futurs clients. Vous avez probablement déjà utilisé ChatGPT ou une autre IA pour poser une question. Nous prenons moins le temps de consulter les sources. Votre expertise a servi à une consolidation d'information, sans vous apporter de nouveaux leads.
Publier sans les protections, c'est risquer de se faire voler son expertise. La publication en ligne de votre contenu constitue une autorisation tacite d'entraînement des modèles d'IA sur vos données. Enfin, pour le moment, car le débat juridique est en cours.
La problématique se pose par conséquent en ces nouveaux termes : comment rester visibles dans un monde où les LLM prennent le relais sur les moteurs de recherche pour trouver de l’information ? Et comment garantir que votre contenu ne vienne alimenter des modèles d’IA générative sans contrepartie ?
Le recul du SEO : technologie phare de l'ère des moteurs de recherche
Pendant longtemps, être visible sur internet signifiait être bien positionné dans Google. Les règles étaient connues : produire du contenu régulier, structuré, pertinent. En tous cas, du contenu qui respectait le cahier des charges du SEO, qui conduisaient vers une harmonisation éditoriale assez malheureuse des sites internet.
Les moteurs de recherche indexaient, classaient, renvoyaient vers votre site.
Et vos futurs clients découvraient votre identité, votre offre de service en même temps qu’ils approchaient votre expertise.
Ce modèle n'a pas disparu, mais commence à marquer le pas en comparaison des recherches sur les IA, qui synthétisent, reformulent, concluent.
Et leurs sources d'information, c'est tout ce qu'ils ont absorbé pendant leur entraînement, complété parfois par ce qu'ils récupèrent en temps réel sur votre site (crawlent).
Le nouveau marketing en ligne des PME-ETI : du GEO à la protection de sa propriété intellectuelle
Pour une PME ou une ETI, la conséquence est double.
Si votre contenu est bien structuré et bien signalé, ces systèmes peuvent vous citer, vous recommander, vous positionner comme référence sur votre domaine.
Si ce n'est pas le cas, ils parleront de votre secteur sans vous mentionner ou pire, ils s'inspireront de votre expertise sans l'attribuer.
Vous perdez ici une perspective de vente : votre expertise n'a plus servi à vous faire connaître pour proposer votre accompagnement.
Être référencé
Être référencé par les IA est un objectif de visibilité. Il s'obtient en structurant votre contenu pour qu'il soit lisible par des systèmes automatisés, avec des règles un peu dérogatoires du SEO.
Les nouveaux principes (GEO) exigent que vous indiquiez clairement qui vous êtes, ce que vous faites, quelles pages sont vos références, quelle est votre zone de compétence.
C'était le problème de mon opticien que j'accompagnais récemment. Il a vécu pendant 15 ans avec un bon référencement Google, du fait qu'il était parmi les pionniers de l'optique durable à Paris.
Mais avec les LLM, son site s'est rapidement retrouvé hors du champ de vision des nouveaux clients, au profit de grands groupes du secteur qui avaient investi dans ces nouvelles techniques de référencement en ligne. Il estimait avoir perdu sur la dernière année près de 20% de nouveaux clients.
Dans l'immédiat, si vous voulez adresser ce problème, l'outil principal sur lequel s’appuyer est un fichier masqué de l’internaute classique, à la racine de votre site. Vous connaissiez peut-être déjà le robots.txt, qui autorisait les moteurs de recherche à référencer (indexer) votre site.
Un nouveau standard émerge depuis 2024, à savoir llms.txt. Son rôle est d'informer les modèles d'IA sur votre contenu et sur les endroits à parcourir de votre site.
Protéger son contenu
Protéger votre contenu de l'entraînement des IA, c'est un objectif de propriété intellectuelle, mais pas seulement.
L'enjeu pour vous est de bien savoir ce que vous consentez à offrir, et de ce que vous souhaitez protéger.
Si les modèles s'entraînent sur votre expertise, ils peuvent la recontextualiser au cas d'usage de votre client, et possiblement lui offrir une partie de ce qui constituait votre offre de service.
Depuis une vingtaine d'années, avec la loi de 2004, les sites internet devaient publier des mentions légales, qui servait de lieu de clarification des droits de propriété intellectuelle sur le contenu du site.
Si cette opération est viable pour des humains, elle ne l’est pas pour des robots chinois qui ne sont pas formés au droit français, et ne vont pas nécessairement inférer le contenu de cette page pour décider ou non de s'alimenter de votre contenu.
Et le silence du droit ici est problématique : si vous conservez la propriété intellectuelle de votre contenu, est-ce pour autant que vous interdisez des robots à parcourir votre site pour récupérer des informations et vous citer dans le cadre d'une recherche ?
C’est ici que s’ajuste le fameux robots.txt, pour préciser les pages qui peuvent ou ne pas être indexées.
S'adapter en attendant une clarification du droit
Poser ses limites
Le cadre juridique européen pose les grands principes.
"L'exception ou la limitation prévue au paragraphe 1 s'applique à condition que l'utilisation des œuvres et autres objets protégés visés audit paragraphe n'ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des moyens lisibles par machine dans le cas de contenus mis à disposition en ligne."
L'AI Act prolonge cette logique, en obligeant les grands fournisseurs à identifier ces réserves et à les appliquer.
"[...] mettre en place une politique visant à respecter le droit de l'Union en matière de droits d'auteur et droits voisins, en particulier à identifier et à respecter, notamment grâce aux technologies les plus récentes, les réservations de droits exprimées en vertu de l'article 4, paragraphe 3, de la directive (UE) 2019/790."
La liste des moyens reconnus juridiquement n'est pas encore publiée ni établie. Une consultation publique est en cours par la Commission européenne.
Qu'est-ce que ça change pour vous ? L'absence de clarification sur votre site (mentions légales, robots.txt) jouera a priori contre vous : vous devez expliciter le cadre dès à présent, et sur les contenus ciblés.
En conclusion : comment optimiser votre référencement GEO ?
Votre contenu mérite d'être segmenté en plusieurs catégories, pour optimiser votre référencement, tout en protégeant votre propriété intellectuelle.
Le premier type de contenu est celui que vous allez vouloir exposer librement, parce qu'il ne relève pas de secrets industriels, ni d'autres secrets protégés par la loi, mais parce qu'ils aident à asseoir votre crédibilité et votre référencement. C'est le contenu que les LLM citent : un résultat chiffré, un contexte nommé, ou une méthode identifiée. "Nous avons augmenté la marge nette de 6%" est un contenu adapté au référencement, "Nous avons une approche experte", moins.
Le deuxième type de contenu est celui que vous avez intérêt à protéger, en particulier parce que vous ne souhaitez pas que les modèles s'en inspirent pour pouvoir le décliner gratuitement aux cas d'usage de vos clients. Il s'agit du détail opératoire de vos méthodes, de vos données clients, de tout ce qui relève d'un savoir-faire différenciant. L'exposer reviendrait à le dévaluer, avant même que la question de la propriété intellectuelle se pose.
Le troisième type de contenu est la zone intermédiaire : une méthode nommée, le résultat agrégé, l'approche décrite en surface. Ce contenu est celui que vous pouvez exposer en explicitant sa condition d'attribution dans le llms.txt de votre site. Autrement dit, autoriser les LLM à le récupérer pour l'alimenter dans une recherche à la condition que vous soyez cité selon vos termes. Cette approche n'est aujourd'hui pas normée, ni juridiquement contraignante, mais elle pourrait être opposable sur la durée, à mesure que le cadre juridique se clarifiera.
Pour ces raisons, il est essentiel que vous conserviez une version datée de vos fichiers et de vos outils, afin de garantir leur traçabilité et leur évolution.
01 - Segmentation stratégique du contenu
Distinguer les résultats chiffrés et le contexte (exposables pour le référencement LLM) du savoir-faire opérationnel et des données sensibles (à protéger pour préserver la propriété intellectuelle).
02 - Exposition crédible sans divulgation
Publier des métriques vérifiables (« +6 % de marge nette ») plutôt que des affirmations génériques, afin d’alimenter les modèles sans révéler de secrets industriels.
03 - Protection du détail opératoire
Sécuriser les méthodes spécifiques, les données clients et les leviers différenciants pour éviter leur appropriation gratuite par des tiers ou des IA.
04 - Zone intermédiaire et attribution
Utiliser une couche de contenu nominal (méthode nommée, résultats agrégés) conditionnée par une clause d’attribution dans le fichier llms.txt, anticipant ainsi l’évolution du cadre juridique.
05 - Traçabilité et versioning
Conserver des versions datées des fichiers et outils pour garantir la preuve de l’antériorité et suivre l’évolution des actifs immatériels face aux enjeux juridiques futurs.