llms.txt: cos'è, come si crea e perché Google sbaglia (ma ChatGPT no)
Il file llms.txt è un file di testo posizionato nella root di un sito web (/llms.txt) che fornisce alle AI e ai crawler dei modelli linguistici un riassunto strutturato del sito, dei suoi contenuti prioritari e delle pagine da considerare per la citazione. Proposto da Jeremy Howard nel settembre 2024, è progettato per ottimizzare la visibilità su ChatGPT, Claude e Perplexity — ma non serve per Google, che ha esplicitamente dichiarato di non utilizzarlo.
Cos’è llms.txt: origini e scopo
Il file llms.txt è stato proposto da Jeremy Howard — cofondatore di fast.ai e uno dei ricercatori di AI più influenti al mondo — nel settembre 2024, sul sito llmstxt.org. L’idea nasce da un’analogia diretta con robots.txt: così come robots.txt comunica ai web crawler come indicizzare un sito, llms.txt comunica agli LLM-crawler cosa vale la pena leggere e citare.
La differenza fondamentale è nello scopo. robots.txt è uno standard di esclusione: dice ai bot cosa non fare. llms.txt è uno standard di prioritizzazione: dice agli LLM cosa è più importante, cosa rappresenta il sito, quali contenuti contengono le informazioni più autorevoli. Non ha potere vincolante, ma i modelli che lo supportano lo usano come segnale di qualità.
Perché è nato llms.txt
Con l’esplosione dei sistemi RAG e dei LLM con accesso web in tempo reale, i modelli AI si trovano a dover “scegliere” quali pagine di un sito leggere. Senza guida, un crawler AI potrebbe indicizzare pagine irrilevanti (termini e condizioni, pagine di login, contenuti duplicati) invece dei contenuti di valore. llms.txt risolve questo problema fornendo un indice curato e orientato alla citabilità. Per approfondire la strategia GEO complessiva, leggi la guida GEO Optimization Italia 2026.
Il paradosso Google: perché dice che non serve (ma ha torto per gli altri LLM)
Il 15 maggio 2026, Google ha pubblicato una guida ufficiale sulla GEO e l’AEO dichiarando esplicitamente che llms.txt non viene utilizzato da Google. La dichiarazione è corretta: Google ha il proprio sistema proprietario di crawling e non ha implementato il supporto a llms.txt.
Tuttavia, Google non è l’unico motore AI che conta nel 2026.
| Motore AI | Fonte di retrieval web | Supporta llms.txt? |
|---|---|---|
| Google AI Mode | Indice Google proprietario | No (dichiarato ufficialmente) |
| ChatGPT | Bing Index (Microsoft) | Sì (via supporto Bing) |
| Claude | Brave Search | Sì (Brave indicizza llms.txt) |
| Perplexity | Vespa (motore proprietario) | Sì (implementazione nativa) |
Fonte: Forrester Research / Search Engine Journal, maggio 2026.
llms.txt non serve per Google ma è rilevante per tutti gli altri LLM principali. Implementarlo richiede meno di 30 minuti e il suo impatto sulle citazioni AI non-Google può essere significativo. Per capire come questi motori trattano le fonti, leggi anche come ChatGPT, Claude e Perplexity scelgono le fonti.
Struttura del file llms.txt: formato e best practice
Il formato llms.txt è volutamente semplice: testo Markdown, diviso in sezioni standard. Ogni sezione ha uno scopo preciso e deve essere compilata con cura per massimizzare l’impatto.
# Nome del Sito o Brand
> Breve descrizione del sito in 1-2 righe. Chi sei, cosa fai, per chi è.
> Questo testo viene estratto dagli LLM come "abstract" del sito.
## Contenuti principali
- [Guida GEO Optimization](/blog/guida-geo-optimization-italia-2026/): Guida completa ai 9 metodi Princeton per ottimizzare la visibilità su ChatGPT, Claude, Perplexity.
- [Servizio GEO Optimization](/services/geo-optimization/): Consulenza GEO per PMI italiane.
- [GEO Optimizer](https://github.com/Auriti-Labs/geo-optimizer-skill): Tool CLI open source per audit GEO.
## Pagine da escludere
- /wp-admin/
- /wp-login.php
- /cart/
- /checkout/
Le 5 sezioni chiave
- Header (# Nome): Il titolo del sito. Usare il brand name esatto, coerente con il tag title della homepage.
- Descrizione (>): Il blockquote iniziale è la parte più importante — viene spesso estratta come “chi è questo sito” dagli LLM.
- Contenuti principali: Lista dei 10-20 contenuti più importanti con URL e descrizione concisa.
- Pagine da escludere: Fondamentale per evitare che i crawler AI perdano tempo su pagine amministrative.
- Note per LLM: Sezione libera per contestualizzare il sito e specificare l’expertise.
Come creare llms.txt: manuale vs automatico con GEO Optimizer
Esistono due approcci: compilazione manuale e generazione automatica. Per siti con meno di 50 pagine, l’approccio manuale è spesso sufficiente. Per siti di medie-grandi dimensioni, l’automazione è essenziale.
Generazione automatica con GEO Optimizer
GEO Optimizer (v4.10.4, MIT License) include un comando dedicato per generare llms.txt a partire dalla sitemap XML:
# Installazione
pip install geo-optimizer-skill
# Generazione llms.txt da sitemap
geo llms --sitemap https://tuosito.it/sitemap.xml --output ./llms.txt
# Opzioni avanzate
geo llms --sitemap https://tuosito.it/sitemap.xml --max-urls 50 --exclude "/wp-admin,/cart,/checkout" --author "Nome Autore" --output ./llms.txt
Dove posizionare llms.txt e come verificarlo
Il file llms.txt deve essere posizionato nella root del dominio principale, accessibile all’URL https://tuosito.it/llms.txt.
Requisiti tecnici
- Content-Type:
text/plainotext/markdown - Charset: UTF-8
- Accessibile senza autenticazione
- Non bloccato da robots.txt
- Dimensione massima consigliata: 100KB
geo audit https://tuosito.it --check-llms
llms.txt vs robots.txt: differenze chiave
| Caratteristica | robots.txt | llms.txt |
|---|---|---|
| Scopo principale | Controllare il crawling dei bot | Orientare la comprensione degli LLM |
| Target | Web crawler (Googlebot, Bingbot, etc.) | LLM crawler e modelli AI |
| Formato | Proprietario (User-agent / Disallow) | Markdown strutturato |
| Standard | RFC 9309 (standard ufficiale) | Proposta comunitaria (non standard ufficiale) |
| Vincolante? | Sì, per crawler conformi | No, facoltativo per gli LLM |
| Supporto Google | Pieno | Nessuno (dichiarato il 15/05/2026) |
| Supporto ChatGPT/Claude | Rispettano robots.txt per crawling | Supporto attivo per citabilità |
La raccomandazione pratica è di usare entrambi in modo coordinato. Assicurati che le pagine elencate in llms.txt non siano bloccate in robots.txt. Per la strategia GEO completa, consulta il nostro servizio GEO Optimization o leggi la guida completa alla GEO Optimization.
Hai già implementato llms.txt? Controlla il tuo GEO Score
GEOReady verifica in 60 secondi se llms.txt è correttamente implementato.
Controlla il tuo GEO Score gratis su GEOReady →
Domande frequenti su llms.txt
llms.txt è uno standard ufficiale?
No. llms.txt è una proposta comunitaria avanzata da Jeremy Howard nel settembre 2024 e documentata su llmstxt.org. Non è uno standard W3C né un RFC ufficiale. Tuttavia, l’adozione da parte di ChatGPT (via Bing), Claude (via Brave) e Perplexity lo rende rilevante per chiunque voglia ottimizzare la propria visibilità sui principali motori AI non-Google.
Google usa llms.txt?
No. Google ha dichiarato ufficialmente il 15 maggio 2026 che llms.txt non viene utilizzato per nessun aspetto dell’indicizzazione o delle AI Overviews. Google ha il proprio sistema proprietario di crawling. Per la visibilità su Google AI Mode, è necessario ottimizzare i contenuti con i metodi GEO standard (dati, tono, struttura).
Quanto spesso devo aggiornare llms.txt?
Aggiorna llms.txt ogni volta che pubblichi contenuti significativi — nuovi articoli pillar, pagine servizi, case study. Per siti con pubblicazione frequente, un aggiornamento mensile è sufficiente. Con GEO Optimizer, la rigenerazione automatica da sitemap può essere integrata nella pipeline di deploy, azzerando il costo di manutenzione.
llms.txt può danneggiare il mio sito?
No. llms.txt è un file passivo: non ha effetti negativi sul crawling tradizionale, sul ranking SEO o sulla sicurezza. Il rischio è solo di un file mal compilato che non produce benefici — non di danni attivi. L’unica accortezza è non elencare pagine sensibili o private.
llms.txt funziona per siti in italiano?
Sì. Il formato llms.txt supporta qualsiasi lingua. Claude e Perplexity gestiscono contenuti in italiano senza problemi. Per il mercato italiano, implementare llms.txt ora rappresenta un vantaggio competitivo reale: la maggioranza dei siti italiani non lo ha ancora fatto.
Juan Camilo Auriti
GEO, AEO & AI Consultant — Creatore di GEO Optimizer e GEOReady
Vuoi ottimizzare il tuo sito per AI search?
Audit GEO gratuito su GEOReady oppure consulenza personalizzata.