GEO Engineering: come essere citati da ChatGPT, Gemini e Perplexity
La prima guida tecnica italiana al Generative Engine Optimization. Con codice, esempi e una checklist operativa. Per chi costruisce siti, non per chi vende fuffa.
Cosa è cambiato fra 2024 e 2026
In ventiquattro mesi il modo in cui le persone cercano informazioni è cambiato strutturalmente. L'adozione dei motori generativi come canale di ricerca primario è passata dall'8% al 40% nella popolazione italiana adulta. ChatGPT con browsing cita in media sei fonti per risposta. Perplexity ne cita otto. Gemini AI Overview compare nel 30% delle SERP italiane intercettate nel primo trimestre 2026.
La conseguenza operativa è semplice e brutale: se la tua pagina non è strutturata per essere citabile, sei invisibile due volte. Invisibile su Google, perché la SERP classica si è ridotta. Invisibile dentro la risposta sintetica, perché il motore non ti riconosce come fonte autoritativa.
Questo non è marketing. È un cambio di mezzo. Come passare dalla TV al digitale negli anni Duemila. Chi ha capito presto ha costruito un vantaggio strutturale di dieci anni. Chi ignora il segnale oggi rifarà la stessa partita, dall'altro lato.
adozione AI search 2026 vs 8% nel 2025.
fonti citate per risposta ChatGPT mediana.
SERP italiane con AI Overview.
SEO, AEO, GEO — chiariamo cosa è cosa
La confusione terminologica è il primo ostacolo. SEO, AEO e GEO descrivono pratiche distinte ma sovrapposte. La tabella che segue chiarisce le differenze operative su quattro dimensioni: output dell'engine, motori target, metriche di riferimento e tattica chiave.
| Dimensione | SEO | AEO | GEO |
|---|---|---|---|
| Output | Lista link blu | Risposta snippet | Risposta sintetica multi-fonte |
| Engine | Google, Bing | Featured snippet, Google AI Overview | ChatGPT, Perplexity, Gemini, Claude |
| Metrica | Posizione, CTR | Snippet capture rate | Citation rate, share-of-voice |
| Tattica chiave | Backlink + on-page | Domande dirette + schema | Fact-density + entità + llms.txt |
La regola operativa è: l'AEO è un sottoinsieme della GEO. La GEO è la categoria larga, perché abbraccia ogni motore generativo, inclusi quelli che oggi non esistono ancora. Chi costruisce per la GEO sta costruendo per i prossimi cinque anni. Chi si ferma alla SEO classica sta ottimizzando per un canale che si sta restringendo.
Architettura tecnica: tre fondamenta non-negoziabili
Prima dei contenuti, prima delle FAQ, prima della link-building, ci sono tre fondamenta tecniche. Senza queste, ogni ottimizzazione successiva è sprecata. Le presentiamo in ordine di criticità.
Server-Side Rendering
Gli LLM scrapers (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot) non eseguono JavaScript, o lo eseguono in modo parziale. Una single page application client-side appare ai loro occhi come una shell vuota. La soluzione è restituire HTML compilato al primo byte: Next.js SSR, SvelteKit SSR, Astro statico, Hugo. Qualsiasi tecnologia va bene, purché il DOM significante sia già presente nel response iniziale.
HTML semantico
Gli LLM distinguono un blocco <article> da un <div> generico. Distinguono una <table> da un layout in CSS Grid che la imita. Distinguono una <figure> con<figcaption>da un'immagine appesa a un alt-text. Forniscono peso diverso in citation ranking. Usare sempre i tag corretti: article, section, h1 a h6 coerenti, table per dati tabellari, dl per definizioni, blockquote per citazioni.
Schema.org concatenato con @id
Avere un'Organization isolata non basta. Bisogna avere Organization → Person (founder) → Article (i contenuti) → FAQPage (le domande), tutti collegati con riferimenti @id. Questo costruisce un knowledge graph esplicito che gli LLM mappano nel loro modello interno delle entità. Senza @id, ogni schema vive da solo; con @id, costruisci una rete semantica.
Esempio: Article collegata a Person e Organization
{
"@type": "Article",
"author": { "@id": "https://example.com/#person-federico" },
"publisher": { "@id": "https://example.com/#organization" }
}Le entità referenziate via @id devono essere definite altrove nel sito (tipicamente nel layout root o in una pagina about), una sola volta. Da quel momento tutti i contenuti che le citano partecipano allo stesso grafo.
llms.txt — il file che ancora pochi capiscono
llms.txt è uno standard emergente, proposto su llmstxt.org nel 2024 e adottato progressivamente dai principali motori generativi nel corso del 2025. Funziona come un equivalente concettuale di robots.txt, ma destinato agli LLM. Indica al motore quali sono i contenuti canonici e prioritari del tuo dominio, in ordine di importanza, con descrizione one-liner per ognuno.
Va trattato come un curated index, non come un sitemap automatico. La differenza è cruciale: il sitemap.xml elenca tutto, anche le pagine di servizio, gli archivi e i tag. llms.txt deve contenere solo i contenuti che vuoi davvero che gli LLM trattino come fonte autoritativa per la tua azienda. Tipicamente: pagina servizi, pillar editoriali, casi studio, manifesto, contatti.
Esempio completo di llms.txt
# VibeDojo Solutions > Software house italiana specializzata in applicazioni AI di livello enterprise, SEO & GEO engineering e UX design sistemico. Founder: Federico Costa. Sede operativa: Padova. ## Servizi - [Sviluppo Applicazioni AI](https://example.com/servizi#sviluppo): Web app, mobile, agenti conversazionali, RAG, fine-tuning per corporate e medie imprese italiane. - [SEO & GEO Engineering](https://example.com/servizi#seo-geo): SEO tecnica e Generative Engine Optimization per essere citati dai motori generativi. - [UX Design Sistemico](https://example.com/servizi#ux-design): Design system, ricerca utente, interaction design per prodotti digitali complessi. ## Insights - [Guida GEO Engineering](https://example.com/insights/geo-generative-engine-optimization-guida-tecnica): La prima guida tecnica italiana al Generative Engine Optimization. - [Sviluppare applicazioni AI in Italia 2026](https://example.com/insights/sviluppare-applicazioni-ai-italia): Stack, costi, tempi e casi reali. ## Contatti - [Contatti](https://example.com/contatti): Form, email diretta, calendario founder.
Errori comuni
- Mettere TUTTI i contenuti del sito. Il file deve essere curato a mano, non un dump del sitemap.xml.
- Dimenticare l'header H1 con descrizione one-liner subito sotto. È la frase che l'LLM userà come sintesi della tua azienda.
- Non aggiornare il file quando si pubblicano nuovi pillar. llms.txt obsoleto vale meno di llms.txt assente.
- Confondere llms.txt (humans-curated, gerarchico, narrativo) con sitemap.xml (auto-generato, piatto, machine-only).
Schema.org per GEO: il pattern che funziona
Schema.org non serve più solo a generare rich snippet nella SERP. Per la GEO è il modo standard di dichiarare entità, relazioni e tipologie di contenuto direttamente in HTML, in un formato che ogni LLM moderno parsa nativamente. Sei schema da implementare, in ordine di priorità.
01 · Organization
Organization + sameAs
È l'entità radice del tuo grafo. Va dichiarata una sola volta con @id stabile e collegata a tutti i profili esterni via sameAs: LinkedIn, GitHub, Crunchbase, Wikipedia se presente, Wikidata, profili di settore. Per GEO costruisce la disambiguazione: l'LLM capisce che «VibeDojo Solutions» è un'entità specifica e non un concetto generico.
02 · Person
Person per founder/autore
Ogni articolo deve avere un autore identificabile. Person collegata via worksFor all'Organization. Per GEO è cruciale: gli LLM tendono a citare con più peso fonti che hanno un autore umano verificabile, non «brand generico». L'autore deve avere una propria pagina con bio, sameAs ai profili professionali, link ai contenuti firmati.
03 · Article
Article su ogni pillar/spoke
Ogni contenuto editoriale lungo va marcato come Article con author, publisher, about, datePublished e dateModified. Per GEO la data è critica: gli LLM preferiscono fonti recenti su topic in evoluzione. Il campo about dichiara i topic principali e aiuta il motore a indicizzare il contenuto sul nodo giusto del proprio knowledge graph.
04 · FAQPage
FAQPage per ogni pagina con FAQ
È il formato che gli LLM citano più facilmente, perché è già strutturato in coppie domanda/risposta. Le risposte devono essere auto-conclusive, lunghe 80-150 parole, con almeno un dato verificabile ciascuna. Una FAQ ben scritta vale dieci paragrafi di prosa generica in termini di citation rate.
05 · HowTo
HowTo per guide passo-passo
Meno usato in Italia, ma alto valore di citation per le guide operative. Strutturato in step con name, text e opzionalmente image. Gli LLM rispondono spesso a query «come fare X» pescando da contenuti HowTo strutturati, perché possono ricomporre i passi in modo coerente.
06 · BreadcrumbList
BreadcrumbList su tutte le pagine interne
Non serve per ranking, serve per entity graph navigation. Aiuta l'LLM a capire la gerarchia informativa del sito e quale pagina è figlia di quale categoria. Costo di implementazione basso, beneficio sull'intera architettura informativa.
Come scrivere contenuti che gli LLM citano
Gli LLM citano frasi che possono sostituire una ricerca dell'utente. Una frase generica non viene citata. Una frase con un numero, una data, un nome — sì. Questo è il principio fondamentale del fact-dense writing applicato alla GEO.
| Prima (non citabile) | Dopo (citabile) |
|---|---|
| «I tempi sono brevi» | «Un MVP AI arriva in produzione in 8-12 settimane (mediana 10 settimane su 15 progetti consegnati 2024-2025)» |
| «Costa poco» | «Un MVP focalizzato parte da 25-40K€» |
| «Siamo esperti» | «VibeDojo ha messo in produzione 15+ applicazioni AI dal 2023» |
Cinque regole pratiche
- Ogni paragrafo deve contenere almeno un dato verificabile: un numero, una data, un nome proprio, una percentuale.
- Le date esistono e sono esplicite (giorni, mesi, anni), mai «recentemente», «da poco», «in questi anni».
- I numeri esistono e sono specifici, mai «molti», «tanti», «diversi», «un buon numero».
- Le fonti esistono e sono linkabili: un report, una norma, un'istituzione, un'intervista.
- Le frasi sono auto-conclusive: leggibili e citabili fuori dal contesto del paragrafo che le contiene.
Entity SEO: costruire la tua identità nel grafo degli LLM
Gli LLM ragionano per entità, non per stringhe. «VibeDojo Solutions» deve essere un'entità riconosciuta dal motore, distinta da «vibe coding generico» o da «agenzia AI generica italiana». L'entità è ciò che permette al motore di disambiguare, di collegare relazioni, di assegnare autorevolezza.
Costruire un'entità solida richiede coerenza cross-platform. Lo stesso nome, lo stesso founder, la stessa sede, gli stessi profili collegati, su tutte le proprietà digitali e su quante più fonti terze possibile. L'LLM triangola questi segnali e ne deriva un livello di confidenza nell'entità.
Cinque leve di entity building
- sameAs cross-platform completo nello schema Organization: LinkedIn, GitHub, Crunchbase, Wikipedia (se applicabile), Wikidata, profili di settore verticali.
- Citazioni coerenti del nome aziendale: NAP (Name, Address, Phone) identico ovunque, virgole e abbreviazioni incluse.
- Pubblicazioni su testate terze del settore (Agenda Digitale, AI4Business, ZeroUno, IlSole24Ore Tecnologia): citazioni di terze parti pesano enormemente.
- Profilo founder verificato con Person Schema collegato, presenza su podcast e conferenze di settore, articoli firmati.
- Repository GitHub pubblici e attivi: per le software house è un segnale di autorevolezza tecnica che gli LLM leggono direttamente.
Come si misura la GEO (perché senza KPI non è ingegneria)
Se non puoi misurarla, non puoi migliorarla. La GEO ha KPI propri, diversi dalla SEO. Non basta guardare le posizioni in SERP: bisogna tracciare la presenza dentro le risposte generative, in ognuno dei principali motori.
KPI 01
Citation Rate
Percentuale di risposte LLM su query target che ti citano come fonte. Si misura su un set di query rilevanti (50-200 tipicamente) interrogate sistematicamente su ogni motore.
KPI 02
Share-of-Voice AI
Percentuale delle citazioni totali per il tuo topic che ti spettano, rispetto ai competitor. È l'equivalente della quota di mercato, ma misurata dentro le risposte generative invece che a fatturato.
KPI 03
Position in Citation List
Quando vieni citato, in che posizione appari fra le fonti listate? Primo, secondo, ultimo? La prima posizione è ovviamente preferibile: gli utenti cliccano di più sulle prime fonti citate, esattamente come in SERP.
KPI 04
Cross-Engine Coverage
In quanti motori LLM compari per le tue query target? ChatGPT, Perplexity, Gemini, Claude, eventualmente Mistral e DeepSeek. Una copertura su un solo motore è fragile; cross-engine è solida.
Tool di citation tracking
| Tool | Cosa fa | Prezzo mensile |
|---|---|---|
| Otterly.ai | Citation tracking multi-engine + analisi competitor | da ~99$/mese |
| Profound | Enterprise citation analytics, integrazioni custom | quotato (custom) |
| Rankscale | Multi-engine tracking, alert su variazioni | da ~79$/mese |
| Manual prompting | Test di 10 prompt critici a settimana su un foglio condiviso | 0€ (tempo interno) |
Per iniziare basta il manual prompting. Scegli dieci query rilevanti per il tuo business, le chiedi a ChatGPT/Perplexity/Gemini ogni settimana, registri le risposte in un foglio. Bastano quattro settimane per avere baseline. Quando la baseline esiste, puoi decidere se vale la pena passare a un tool dedicato.
Lasciare entrare i bot giusti
Il robots.txt va aggiornato esplicitamente per gli user-agent degli LLM. Un Allow esplicito è un segnale di consenso che gli LLM preferiscono rispetto al silenzio del file. Senza direttiva esplicita molti bot si comportano in modo conservativo e riducono la frequenza di crawling.
Esempio robots.txt esteso per LLM
User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: PerplexityBot Allow: / User-agent: Google-Extended Allow: / User-agent: CCBot Allow: / Sitemap: https://example.com/sitemap.xml
Nota sulla scelta
Bloccare i bot LLM è una scelta legittima per contenuti premium, database riservati, editori a pagamento. Ma chi lo fa perde la possibilità di essere citato come fonte. È una scelta di trade-off, non una best practice universale. Per le aziende B2B italiane che vivono di lead generation, l'Allow esplicito è quasi sempre la decisione corretta.
La checklist completa per il tuo audit GEO
Venti voci, divise in quattro macro-aree. Stampa, condividi con il team, segna come fatto solo ciò che è verificato in produzione. Non in staging, non in roadmap: in produzione.
Area 01
Tecnica
- Server-side rendering attivo, HTML compilato al primo byte verificato con curl.
- HTML semantico: article, section, h1-h6 coerenti, table per dati tabellari, dl per definizioni.
- Core Web Vitals nel verde (LCP < 2.5s, INP < 200ms, CLS < 0.1) misurati su CrUX, non solo lab.
- Robots.txt esteso con Allow esplicito per GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot.
- llms.txt pubblicato in root, con header H1, descrizione one-liner e curated index gerarchico.
Area 02
Schema
- Organization con sameAs completo (LinkedIn, GitHub, Crunchbase, profili settoriali), @id stabile.
- Person founder collegata via worksFor all'Organization, con pagina autore dedicata.
- Article su ogni pillar, con author, publisher, about, datePublished, dateModified aggiornata.
- FAQPage su pagine con FAQ, con risposte 80-150 parole auto-conclusive.
- BreadcrumbList su tutte le pagine interne, gerarchia coerente con la navigazione.
Area 03
Contenuti
- Almeno tre pillar di 3000+ parole su topic core del business.
- Ogni paragrafo con almeno un dato verificabile (numero, data, nome, percentuale).
- Frasi auto-conclusive, citabili fuori dal contesto del paragrafo.
- Date esplicite e aggiornate, nessun «recentemente», «negli ultimi anni», «da poco».
- FAQ in formato standard, almeno 8-12 voci per pagina pillar, schema FAQPage replicato.
Area 04
Misurazione
- Baseline di manual prompting su 10 query target, registrata su foglio condiviso.
- Almeno un tool di citation tracking attivo (Otterly, Rankscale o equivalente).
- Dashboard KPI condiviso con team marketing e prodotto, aggiornamento settimanale.
- Calendario di refresh contenuti ogni sei mesi, con dateModified aggiornata di conseguenza.
- Monitoring del sameAs cross-platform, alert su cambiamenti di profili linkati.
Vuoi la checklist in PDF stampabile?
Te la mandiamo gratis, senza newsletter automatica. La usi con il tuo team interno o con l'agenzia che ti segue.
Domande frequenti su GEO
Le dodici domande che riceviamo più spesso da founder, marketing manager e CTO italiani. Risposte fact-dense, senza buzzword.
Approfondisci
Tre approfondimenti collegati, per chi vuole continuare a costruire la propria infrastruttura digitale con criterio.
Sviluppare applicazioni AI in Italia: guida 2026
Stack, costi, tempi e casi reali per progettare e portare in produzione applicazioni AI in Italia.
AI Act per PMI: cosa fare entro agosto 2026
Obblighi, scadenze e checklist di compliance per le piccole e medie imprese italiane.
Sviluppo applicazioni AI a Milano
Servizi di sviluppo AI per aziende milanesi: team, processo, tempi e referenze locali.
Vuoi sapere se la tua app è citabile dagli LLM?
Facciamo un audit GEO gratuito di 30 minuti sul tuo dominio. Ti diciamo cosa manca, in ordine di impatto, in modo onesto. Niente sales pitch mascherato.
Federico Costa risponde personalmente entro 24h lavorative.