Vai al contenuto principale

llms.txt: cos'è, come si crea e perché Google sbaglia (ma ChatGPT no)

7 min lettura min di lettura
llms.txt guida completa: struttura formato e creazione con GEO Optimizer per ChatGPT Claude Perplexity

Il file llms.txt è un file di testo posizionato nella root di un sito web (/llms.txt) che fornisce alle AI e ai crawler dei modelli linguistici un riassunto strutturato del sito, dei suoi contenuti prioritari e delle pagine da considerare per la citazione. Proposto da Jeremy Howard nel settembre 2024, è progettato per ottimizzare la visibilità su ChatGPT, Claude e Perplexity — ma non serve per Google, che ha esplicitamente dichiarato di non utilizzarlo.

Cos’è llms.txt: origini e scopo

Il file llms.txt è stato proposto da Jeremy Howard — cofondatore di fast.ai e uno dei ricercatori di AI più influenti al mondo — nel settembre 2024, sul sito llmstxt.org. L’idea nasce da un’analogia diretta con robots.txt: così come robots.txt comunica ai web crawler come indicizzare un sito, llms.txt comunica agli LLM-crawler cosa vale la pena leggere e citare.

La differenza fondamentale è nello scopo. robots.txt è uno standard di esclusione: dice ai bot cosa non fare. llms.txt è uno standard di prioritizzazione: dice agli LLM cosa è più importante, cosa rappresenta il sito, quali contenuti contengono le informazioni più autorevoli. Non ha potere vincolante, ma i modelli che lo supportano lo usano come segnale di qualità.

Perché è nato llms.txt

Con l’esplosione dei sistemi RAG e dei LLM con accesso web in tempo reale, i modelli AI si trovano a dover “scegliere” quali pagine di un sito leggere. Senza guida, un crawler AI potrebbe indicizzare pagine irrilevanti (termini e condizioni, pagine di login, contenuti duplicati) invece dei contenuti di valore. llms.txt risolve questo problema fornendo un indice curato e orientato alla citabilità. Per approfondire la strategia GEO complessiva, leggi la guida GEO Optimization Italia 2026.

Il paradosso Google: perché dice che non serve (ma ha torto per gli altri LLM)

Il 15 maggio 2026, Google ha pubblicato una guida ufficiale sulla GEO e l’AEO dichiarando esplicitamente che llms.txt non viene utilizzato da Google. La dichiarazione è corretta: Google ha il proprio sistema proprietario di crawling e non ha implementato il supporto a llms.txt.

Tuttavia, Google non è l’unico motore AI che conta nel 2026.

Motore AI Fonte di retrieval web Supporta llms.txt?
Google AI Mode Indice Google proprietario No (dichiarato ufficialmente)
ChatGPT Bing Index (Microsoft) Sì (via supporto Bing)
Claude Brave Search Sì (Brave indicizza llms.txt)
Perplexity Vespa (motore proprietario) Sì (implementazione nativa)

Fonte: Forrester Research / Search Engine Journal, maggio 2026.

llms.txt non serve per Google ma è rilevante per tutti gli altri LLM principali. Implementarlo richiede meno di 30 minuti e il suo impatto sulle citazioni AI non-Google può essere significativo. Per capire come questi motori trattano le fonti, leggi anche come ChatGPT, Claude e Perplexity scelgono le fonti.

Struttura del file llms.txt: formato e best practice

Il formato llms.txt è volutamente semplice: testo Markdown, diviso in sezioni standard. Ogni sezione ha uno scopo preciso e deve essere compilata con cura per massimizzare l’impatto.

# Nome del Sito o Brand

> Breve descrizione del sito in 1-2 righe. Chi sei, cosa fai, per chi è.
> Questo testo viene estratto dagli LLM come "abstract" del sito.

## Contenuti principali

- [Guida GEO Optimization](/blog/guida-geo-optimization-italia-2026/): Guida completa ai 9 metodi Princeton per ottimizzare la visibilità su ChatGPT, Claude, Perplexity.
- [Servizio GEO Optimization](/services/geo-optimization/): Consulenza GEO per PMI italiane.
- [GEO Optimizer](https://github.com/Auriti-Labs/geo-optimizer-skill): Tool CLI open source per audit GEO.

## Pagine da escludere

- /wp-admin/
- /wp-login.php
- /cart/
- /checkout/

Le 5 sezioni chiave

  • Header (# Nome): Il titolo del sito. Usare il brand name esatto, coerente con il tag title della homepage.
  • Descrizione (>): Il blockquote iniziale è la parte più importante — viene spesso estratta come “chi è questo sito” dagli LLM.
  • Contenuti principali: Lista dei 10-20 contenuti più importanti con URL e descrizione concisa.
  • Pagine da escludere: Fondamentale per evitare che i crawler AI perdano tempo su pagine amministrative.
  • Note per LLM: Sezione libera per contestualizzare il sito e specificare l’expertise.

Come creare llms.txt: manuale vs automatico con GEO Optimizer

Esistono due approcci: compilazione manuale e generazione automatica. Per siti con meno di 50 pagine, l’approccio manuale è spesso sufficiente. Per siti di medie-grandi dimensioni, l’automazione è essenziale.

Generazione automatica con GEO Optimizer

GEO Optimizer (v4.10.4, MIT License) include un comando dedicato per generare llms.txt a partire dalla sitemap XML:

# Installazione
pip install geo-optimizer-skill

# Generazione llms.txt da sitemap
geo llms --sitemap https://tuosito.it/sitemap.xml --output ./llms.txt

# Opzioni avanzate
geo llms   --sitemap https://tuosito.it/sitemap.xml   --max-urls 50   --exclude "/wp-admin,/cart,/checkout"   --author "Nome Autore"   --output ./llms.txt
llms.txt guida completa: struttura formato e creazione con GEO Optimizer
Esempio di struttura llms.txt ottimizzato per ChatGPT, Claude e Perplexity

Dove posizionare llms.txt e come verificarlo

Il file llms.txt deve essere posizionato nella root del dominio principale, accessibile all’URL https://tuosito.it/llms.txt.

Requisiti tecnici

  • Content-Type: text/plain o text/markdown
  • Charset: UTF-8
  • Accessibile senza autenticazione
  • Non bloccato da robots.txt
  • Dimensione massima consigliata: 100KB
geo audit https://tuosito.it --check-llms

llms.txt vs robots.txt: differenze chiave

Caratteristica robots.txt llms.txt
Scopo principale Controllare il crawling dei bot Orientare la comprensione degli LLM
Target Web crawler (Googlebot, Bingbot, etc.) LLM crawler e modelli AI
Formato Proprietario (User-agent / Disallow) Markdown strutturato
Standard RFC 9309 (standard ufficiale) Proposta comunitaria (non standard ufficiale)
Vincolante? Sì, per crawler conformi No, facoltativo per gli LLM
Supporto Google Pieno Nessuno (dichiarato il 15/05/2026)
Supporto ChatGPT/Claude Rispettano robots.txt per crawling Supporto attivo per citabilità

La raccomandazione pratica è di usare entrambi in modo coordinato. Assicurati che le pagine elencate in llms.txt non siano bloccate in robots.txt. Per la strategia GEO completa, consulta il nostro servizio GEO Optimization o leggi la guida completa alla GEO Optimization.

Hai già implementato llms.txt? Controlla il tuo GEO Score
GEOReady verifica in 60 secondi se llms.txt è correttamente implementato.
Controlla il tuo GEO Score gratis su GEOReady →

Domande frequenti su llms.txt

llms.txt è uno standard ufficiale?

No. llms.txt è una proposta comunitaria avanzata da Jeremy Howard nel settembre 2024 e documentata su llmstxt.org. Non è uno standard W3C né un RFC ufficiale. Tuttavia, l’adozione da parte di ChatGPT (via Bing), Claude (via Brave) e Perplexity lo rende rilevante per chiunque voglia ottimizzare la propria visibilità sui principali motori AI non-Google.

Google usa llms.txt?

No. Google ha dichiarato ufficialmente il 15 maggio 2026 che llms.txt non viene utilizzato per nessun aspetto dell’indicizzazione o delle AI Overviews. Google ha il proprio sistema proprietario di crawling. Per la visibilità su Google AI Mode, è necessario ottimizzare i contenuti con i metodi GEO standard (dati, tono, struttura).

Quanto spesso devo aggiornare llms.txt?

Aggiorna llms.txt ogni volta che pubblichi contenuti significativi — nuovi articoli pillar, pagine servizi, case study. Per siti con pubblicazione frequente, un aggiornamento mensile è sufficiente. Con GEO Optimizer, la rigenerazione automatica da sitemap può essere integrata nella pipeline di deploy, azzerando il costo di manutenzione.

llms.txt può danneggiare il mio sito?

No. llms.txt è un file passivo: non ha effetti negativi sul crawling tradizionale, sul ranking SEO o sulla sicurezza. Il rischio è solo di un file mal compilato che non produce benefici — non di danni attivi. L’unica accortezza è non elencare pagine sensibili o private.

llms.txt funziona per siti in italiano?

Sì. Il formato llms.txt supporta qualsiasi lingua. Claude e Perplexity gestiscono contenuti in italiano senza problemi. Per il mercato italiano, implementare llms.txt ora rappresenta un vantaggio competitivo reale: la maggioranza dei siti italiani non lo ha ancora fatto.

Juan Camilo Auriti

Juan Camilo Auriti

GEO, AEO & AI Consultant — Creatore di GEO Optimizer e GEOReady

Vuoi ottimizzare il tuo sito per AI search?

Audit GEO gratuito su GEOReady oppure consulenza personalizzata.

Condividi LinkedIn