Depuis quelques mois, la même question revient dans ma boîte mail : « J'ai entendu parler du fichier llms.txt, il paraît que ça aide à être cité par ChatGPT. Je dois l'ajouter à mon site ? » Réponse courte : ça ne coûte presque rien, mais pour la plupart des sites ça ne changera rien aujourd'hui. Voici pourquoi, et surtout les rares cas où ça vaut vraiment le coup.
C'est quoi llms.txt, concrètement ?
llms.txt est un fichier texte (au format Markdown) que l'on place à la racine d'un site, à l'adresse votresite.fr/llms.txt. Son but : donner aux intelligences artificielles une carte simplifiée de votre contenu le plus important, écrite dans un format qu'un modèle de langage lit facilement. L'idée a été proposée le 3 septembre 2024 par Jeremy Howard, cofondateur d'Answer.AI (et de fast.ai), et publiée sur le site llmstxt.org.
Le raisonnement de départ est simple. Quand une IA veut comprendre votre site, elle se heurte à deux obstacles : le HTML d'une page est rempli de bruit (menus, scripts, bannières de cookies, encarts publicitaires), et un modèle ne peut ingérer qu'une quantité limitée de texte à la fois (sa « fenêtre de contexte »). llms.txt propose de contourner ces deux problèmes en offrant, dans un seul fichier propre, l'essentiel : qui vous êtes, vos pages clés, et des liens vers vos contenus rédigés en Markdown.
Le format tient en quelques règles. Un titre principal (le nom de votre site), un court résumé en citation, puis des sections avec des listes de liens. Une section nommée « Optional » regroupe les liens secondaires, que l'IA peut ignorer si elle manque de place. Concrètement, un llms.txt minimal ressemble à ça :
# Mon entreprise> Agence web spécialisée dans les sites rapides pour PME.## Pages clés- [Nos services](https://exemple.fr/services) : ce qu'on fait, pour qui- [Études de cas](https://exemple.fr/projets) : exemples concrets de réalisations## Optional- [Mentions légales](https://exemple.fr/mentions) : informations juridiques
Il existe aussi un fichier compagnon, llms-full.txt, qui contient cette fois le texte intégral de vos pages, concaténé en un seul document Markdown. C'est ce second fichier que les assistants de code apprécient le plus, car ils y trouvent toute la matière d'un coup.
Est-ce que les IA lisent vraiment ce fichier ?
C'est là que tout se joue, et la réponse honnête dérange un peu : pour la recherche grand public, non. Aucun des grands moteurs (Google, OpenAI, Perplexity) n'a confirmé se servir de llms.txt pour répondre à vos questions ou citer votre site, et les analyses de logs serveur le confirment. Sur une étude de 90 jours côté OtterlyAI, le fichier n'a été demandé que dans 0,1 % des visites de robots d'IA. Une autre étude (SE Ranking, plus de 300 000 domaines analysés) n'a trouvé aucune corrélation entre le fait d'avoir un llms.txt et le fait d'être cité par une IA.
Côté Google, le discours est clair. John Mueller (porte-parole bien connu sur le référencement) a résumé en avril 2025 : à sa connaissance, aucun service d'IA n'a dit utiliser llms.txt, et on le voit dans les logs serveur, ils ne vont même pas vérifier sa présence. Il a comparé le fichier à la vieille balise meta « keywords », celle que les moteurs ont fini par ignorer parce qu'elle est remplie par le propriétaire du site, donc facile à manipuler. En juillet 2025, Gary Illyes (toujours chez Google) a confirmé sur scène que Google ne prend pas en charge llms.txt et n'a pas prévu de le faire.
Il y a pourtant un cas où le fichier sert réellement, et c'est important de le savoir : les assistants de code. Quand vous pointez un outil comme Cursor, Claude Code, GitHub Copilot ou Windsurf vers une documentation technique, ils vont chercher /llms.txt et /llms-full.txt pour charger la doc proprement. C'est d'ailleurs pour ça que des sites comme Stripe, Vercel, Cloudflare ou Anthropic publient le leur. Le fichier marche donc déjà, mais dans un usage précis (la documentation lue par des agents de développement), pas dans la recherche grand public.
llms.txt n'est ni un robots.txt, ni un sitemap
La confusion la plus fréquente, c'est de croire que llms.txt sert à autoriser ou bloquer les IA. Ce n'est pas du tout sa fonction. Trois fichiers cohabitent à la racine d'un site, et chacun a un rôle distinct qu'il vaut mieux ne pas mélanger.
Le robots.txt est un standard ancien (1994) et largement respecté : il dit aux robots ce qu'ils ont le droit de parcourir ou non. C'est lui, et lui seul, qui sert à autoriser ou interdire les robots d'IA comme GPTBot (OpenAI), ClaudeBot (Anthropic) ou PerplexityBot. Le sitemap.xml, lui, liste l'ensemble de vos URLs pour aider les moteurs à tout indexer. Le llms.txt, enfin, ne contrôle aucun accès et n'est pas un signal de classement : c'est une carte curatée de vos meilleurs contenus, en Markdown, que vous proposez aux IA en espérant qu'elles s'en servent.
La conséquence pratique est nette. Si votre objectif est d'empêcher une IA d'aspirer votre contenu, ou au contraire de l'y autoriser pour avoir une chance d'être cité, c'est dans le robots.txt que ça se passe, pas dans le llms.txt. Confondre les deux, c'est passer à côté du vrai réglage.
Faut-il l'ajouter à votre site ? Ma réponse
Ma position tient en une phrase : ajoutez-le si vous publiez de la documentation technique, sinon ce n'est pas une priorité aujourd'hui. Le fichier est statique, il ne pèse rien, il n'affecte pas votre classement Google, et il ne peut pas « casser » votre site. Le seul vrai coût, c'est de le maintenir à jour pour qu'il ne devienne pas un document mort qui décrit un site qui a changé.
Si vous éditez un site de documentation, une API, un produit en ligne (SaaS) ou une base de connaissances, le rapport effort/bénéfice penche clairement en sa faveur : les assistants de code lisent déjà le fichier, vos utilisateurs développeurs en profitent directement, et beaucoup d'outils de doc le génèrent automatiquement. Pour ce profil, je le mets en place sans hésiter.
Si vous gérez un site vitrine de PME de quelques pages, c'est une autre histoire. L'ajouter ne vous fera pas de mal, mais il ne déplacera pas les lignes : à peine 10 % des sites en ont un, aucun moteur de recherche IA ne le lit, et votre contenu tient déjà sur quelques pages qu'une IA parcourt sans difficulté. Dans ce cas, je préfère mettre votre énergie ailleurs, sur les leviers dont l'effet, lui, est documenté.
Ce qui compte vraiment pour être lu par les IA
Avant de courir après llms.txt, il y a des fondations qui ont un effet réel sur votre visibilité dans les réponses d'IA. C'est moins « tendance », mais c'est ce qui marche aujourd'hui. La bonne nouvelle : ce sont aussi les bases d'un bon référencement classique, donc l'effort sert deux fois.
Concrètement, je regarde toujours ces points dans l'ordre. D'abord, votre site doit être réellement accessible aux robots d'IA (vérifiez que votre robots.txt ne bloque pas GPTBot, ClaudeBot ou PerplexityBot si vous voulez être cité). Ensuite, un HTML propre et bien structuré (titres hiérarchisés, texte dans le code et pas uniquement dans des images). Puis des données structurées au format schema.org, qui aident les machines à comprendre la nature de vos pages. Et enfin, des passages clairs et auto-suffisants : une IA cite plus volontiers un paragraphe qui répond à une question de façon complète et autonome. C'est exactement le travail que je détaille sur ma page dédiée pour être visible sur Google et les IA.
llms.txt, dans ce paysage, est la cerise sur le gâteau, pas le gâteau. Posez les fondations d'abord. Si après ça vous voulez ajouter le fichier par anticipation, allez-y : au pire il ne sert à rien pour l'instant, au mieux vous prenez de l'avance si la pratique se généralise. Si vous hésitez sur l'ordre des priorités pour votre site, on en parle.
FAQ
llms.txt améliore-t-il mon référencement sur Google ?
Non. Ce n'est pas un signal de classement, et Google a confirmé ne pas l'utiliser, ni pour la recherche, ni pour ses réponses générées par IA. Son périmètre utile aujourd'hui, c'est la documentation technique lue par des assistants de code, pas le positionnement classique.
Où placer le fichier llms.txt et sous quel format ?
À la racine de votre domaine, accessible à votresite.fr/llms.txt, au format Markdown. Le format de base : un titre principal (le nom du site), un résumé en citation, puis des sections avec des listes de liens annotés vers vos pages importantes.
Quelle différence entre llms.txt et llms-full.txt ?
llms.txt est une carte curatée : surtout des liens et de courtes descriptions vers vos contenus clés. llms-full.txt contient le texte intégral de ces contenus concaténé en un seul fichier, pour qu'une IA puisse tout lire d'un coup sans visiter chaque page.
Est-ce que l'ajouter peut nuire à mon site ?
Non. C'est un fichier statique qui n'affecte ni votre vitesse, ni votre classement, ni votre sécurité. Le seul risque est de l'oublier et de le laisser décrire un site qui a évolué, donc pensez à le mettre à jour quand votre contenu change.
Comment savoir si une IA lit mon site ?
En regardant les logs de votre serveur : vous y verrez passer des robots identifiables par leur user-agent, comme GPTBot, ClaudeBot ou PerplexityBot. C'est aussi via ces noms, dans votre robots.txt, que vous décidez de les autoriser ou de les bloquer.
Sources
- llms.txt (spécification officielle) : la proposition d'origine, avec le format exact et l'objectif du fichier
- Answer.AI : la proposition de Jeremy Howard : l'annonce d'origine du 3 septembre 2024 par l'auteur du format
- Search Engine Journal : Google compare llms.txt à la balise keywords : reprend la position publique de John Mueller sur le fichier
- Ahrefs : What Is llms.txt, and Should You Care About It? : analyse de logs serveur montrant que les robots d'IA ne demandent pas le fichier
- SE Ranking : étude sur 300 000 domaines : aucune corrélation mesurée entre présence d'un llms.txt et citations par les IA
