VibeDojoSolutions
Pillar · GEO Engineering

GEO Engineering: come essere citati da ChatGPT, Gemini e Perplexity

La prima guida tecnica italiana al Generative Engine Optimization. Con codice, esempi e una checklist operativa. Per chi costruisce siti, non per chi vende fuffa.

Stato dell'arte

Cosa è cambiato fra 2024 e 2026

In ventiquattro mesi il modo in cui le persone cercano informazioni è cambiato strutturalmente. L'adozione dei motori generativi come canale di ricerca primario è passata dall'8% al 40% nella popolazione italiana adulta. ChatGPT con browsing cita in media sei fonti per risposta. Perplexity ne cita otto. Gemini AI Overview compare nel 30% delle SERP italiane intercettate nel primo trimestre 2026.

La conseguenza operativa è semplice e brutale: se la tua pagina non è strutturata per essere citabile, sei invisibile due volte. Invisibile su Google, perché la SERP classica si è ridotta. Invisibile dentro la risposta sintetica, perché il motore non ti riconosce come fonte autoritativa.

Questo non è marketing. È un cambio di mezzo. Come passare dalla TV al digitale negli anni Duemila. Chi ha capito presto ha costruito un vantaggio strutturale di dieci anni. Chi ignora il segnale oggi rifarà la stessa partita, dall'altro lato.

40%

adozione AI search 2026 vs 8% nel 2025.

6

fonti citate per risposta ChatGPT mediana.

30%

SERP italiane con AI Overview.

Tassonomia

SEO, AEO, GEO — chiariamo cosa è cosa

La confusione terminologica è il primo ostacolo. SEO, AEO e GEO descrivono pratiche distinte ma sovrapposte. La tabella che segue chiarisce le differenze operative su quattro dimensioni: output dell'engine, motori target, metriche di riferimento e tattica chiave.

DimensioneSEOAEOGEO
OutputLista link bluRisposta snippetRisposta sintetica multi-fonte
EngineGoogle, BingFeatured snippet, Google AI OverviewChatGPT, Perplexity, Gemini, Claude
MetricaPosizione, CTRSnippet capture rateCitation rate, share-of-voice
Tattica chiaveBacklink + on-pageDomande dirette + schemaFact-density + entità + llms.txt

La regola operativa è: l'AEO è un sottoinsieme della GEO. La GEO è la categoria larga, perché abbraccia ogni motore generativo, inclusi quelli che oggi non esistono ancora. Chi costruisce per la GEO sta costruendo per i prossimi cinque anni. Chi si ferma alla SEO classica sta ottimizzando per un canale che si sta restringendo.

Architettura

Architettura tecnica: tre fondamenta non-negoziabili

Prima dei contenuti, prima delle FAQ, prima della link-building, ci sono tre fondamenta tecniche. Senza queste, ogni ottimizzazione successiva è sprecata. Le presentiamo in ordine di criticità.

01

Server-Side Rendering

Gli LLM scrapers (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot) non eseguono JavaScript, o lo eseguono in modo parziale. Una single page application client-side appare ai loro occhi come una shell vuota. La soluzione è restituire HTML compilato al primo byte: Next.js SSR, SvelteKit SSR, Astro statico, Hugo. Qualsiasi tecnologia va bene, purché il DOM significante sia già presente nel response iniziale.

02

HTML semantico

Gli LLM distinguono un blocco <article> da un <div> generico. Distinguono una <table> da un layout in CSS Grid che la imita. Distinguono una <figure> con<figcaption>da un'immagine appesa a un alt-text. Forniscono peso diverso in citation ranking. Usare sempre i tag corretti: article, section, h1 a h6 coerenti, table per dati tabellari, dl per definizioni, blockquote per citazioni.

03

Schema.org concatenato con @id

Avere un'Organization isolata non basta. Bisogna avere Organization Person (founder) → Article (i contenuti) → FAQPage (le domande), tutti collegati con riferimenti @id. Questo costruisce un knowledge graph esplicito che gli LLM mappano nel loro modello interno delle entità. Senza @id, ogni schema vive da solo; con @id, costruisci una rete semantica.

Esempio: Article collegata a Person e Organization

{
  "@type": "Article",
  "author": { "@id": "https://example.com/#person-federico" },
  "publisher": { "@id": "https://example.com/#organization" }
}

Le entità referenziate via @id devono essere definite altrove nel sito (tipicamente nel layout root o in una pagina about), una sola volta. Da quel momento tutti i contenuti che le citano partecipano allo stesso grafo.

Standard emergente

llms.txt — il file che ancora pochi capiscono

llms.txt è uno standard emergente, proposto su llmstxt.org nel 2024 e adottato progressivamente dai principali motori generativi nel corso del 2025. Funziona come un equivalente concettuale di robots.txt, ma destinato agli LLM. Indica al motore quali sono i contenuti canonici e prioritari del tuo dominio, in ordine di importanza, con descrizione one-liner per ognuno.

Va trattato come un curated index, non come un sitemap automatico. La differenza è cruciale: il sitemap.xml elenca tutto, anche le pagine di servizio, gli archivi e i tag. llms.txt deve contenere solo i contenuti che vuoi davvero che gli LLM trattino come fonte autoritativa per la tua azienda. Tipicamente: pagina servizi, pillar editoriali, casi studio, manifesto, contatti.

Esempio completo di llms.txt

# VibeDojo Solutions

> Software house italiana specializzata in applicazioni AI di livello enterprise, SEO & GEO engineering e UX design sistemico. Founder: Federico Costa. Sede operativa: Padova.

## Servizi
- [Sviluppo Applicazioni AI](https://example.com/servizi#sviluppo): Web app, mobile, agenti conversazionali, RAG, fine-tuning per corporate e medie imprese italiane.
- [SEO & GEO Engineering](https://example.com/servizi#seo-geo): SEO tecnica e Generative Engine Optimization per essere citati dai motori generativi.
- [UX Design Sistemico](https://example.com/servizi#ux-design): Design system, ricerca utente, interaction design per prodotti digitali complessi.

## Insights
- [Guida GEO Engineering](https://example.com/insights/geo-generative-engine-optimization-guida-tecnica): La prima guida tecnica italiana al Generative Engine Optimization.
- [Sviluppare applicazioni AI in Italia 2026](https://example.com/insights/sviluppare-applicazioni-ai-italia): Stack, costi, tempi e casi reali.

## Contatti
- [Contatti](https://example.com/contatti): Form, email diretta, calendario founder.

Errori comuni

  • Mettere TUTTI i contenuti del sito. Il file deve essere curato a mano, non un dump del sitemap.xml.
  • Dimenticare l'header H1 con descrizione one-liner subito sotto. È la frase che l'LLM userà come sintesi della tua azienda.
  • Non aggiornare il file quando si pubblicano nuovi pillar. llms.txt obsoleto vale meno di llms.txt assente.
  • Confondere llms.txt (humans-curated, gerarchico, narrativo) con sitemap.xml (auto-generato, piatto, machine-only).
Schema engineering

Schema.org per GEO: il pattern che funziona

Schema.org non serve più solo a generare rich snippet nella SERP. Per la GEO è il modo standard di dichiarare entità, relazioni e tipologie di contenuto direttamente in HTML, in un formato che ogni LLM moderno parsa nativamente. Sei schema da implementare, in ordine di priorità.

01 · Organization

Organization + sameAs

È l'entità radice del tuo grafo. Va dichiarata una sola volta con @id stabile e collegata a tutti i profili esterni via sameAs: LinkedIn, GitHub, Crunchbase, Wikipedia se presente, Wikidata, profili di settore. Per GEO costruisce la disambiguazione: l'LLM capisce che «VibeDojo Solutions» è un'entità specifica e non un concetto generico.

02 · Person

Person per founder/autore

Ogni articolo deve avere un autore identificabile. Person collegata via worksFor all'Organization. Per GEO è cruciale: gli LLM tendono a citare con più peso fonti che hanno un autore umano verificabile, non «brand generico». L'autore deve avere una propria pagina con bio, sameAs ai profili professionali, link ai contenuti firmati.

03 · Article

Article su ogni pillar/spoke

Ogni contenuto editoriale lungo va marcato come Article con author, publisher, about, datePublished e dateModified. Per GEO la data è critica: gli LLM preferiscono fonti recenti su topic in evoluzione. Il campo about dichiara i topic principali e aiuta il motore a indicizzare il contenuto sul nodo giusto del proprio knowledge graph.

04 · FAQPage

FAQPage per ogni pagina con FAQ

È il formato che gli LLM citano più facilmente, perché è già strutturato in coppie domanda/risposta. Le risposte devono essere auto-conclusive, lunghe 80-150 parole, con almeno un dato verificabile ciascuna. Una FAQ ben scritta vale dieci paragrafi di prosa generica in termini di citation rate.

05 · HowTo

HowTo per guide passo-passo

Meno usato in Italia, ma alto valore di citation per le guide operative. Strutturato in step con name, text e opzionalmente image. Gli LLM rispondono spesso a query «come fare X» pescando da contenuti HowTo strutturati, perché possono ricomporre i passi in modo coerente.

06 · BreadcrumbList

BreadcrumbList su tutte le pagine interne

Non serve per ranking, serve per entity graph navigation. Aiuta l'LLM a capire la gerarchia informativa del sito e quale pagina è figlia di quale categoria. Costo di implementazione basso, beneficio sull'intera architettura informativa.

Content engineering

Come scrivere contenuti che gli LLM citano

Gli LLM citano frasi che possono sostituire una ricerca dell'utente. Una frase generica non viene citata. Una frase con un numero, una data, un nome — sì. Questo è il principio fondamentale del fact-dense writing applicato alla GEO.

Prima (non citabile)Dopo (citabile)
«I tempi sono brevi»«Un MVP AI arriva in produzione in 8-12 settimane (mediana 10 settimane su 15 progetti consegnati 2024-2025)»
«Costa poco»«Un MVP focalizzato parte da 25-40K€»
«Siamo esperti»«VibeDojo ha messo in produzione 15+ applicazioni AI dal 2023»

Cinque regole pratiche

  • Ogni paragrafo deve contenere almeno un dato verificabile: un numero, una data, un nome proprio, una percentuale.
  • Le date esistono e sono esplicite (giorni, mesi, anni), mai «recentemente», «da poco», «in questi anni».
  • I numeri esistono e sono specifici, mai «molti», «tanti», «diversi», «un buon numero».
  • Le fonti esistono e sono linkabili: un report, una norma, un'istituzione, un'intervista.
  • Le frasi sono auto-conclusive: leggibili e citabili fuori dal contesto del paragrafo che le contiene.
Entità

Entity SEO: costruire la tua identità nel grafo degli LLM

Gli LLM ragionano per entità, non per stringhe. «VibeDojo Solutions» deve essere un'entità riconosciuta dal motore, distinta da «vibe coding generico» o da «agenzia AI generica italiana». L'entità è ciò che permette al motore di disambiguare, di collegare relazioni, di assegnare autorevolezza.

Costruire un'entità solida richiede coerenza cross-platform. Lo stesso nome, lo stesso founder, la stessa sede, gli stessi profili collegati, su tutte le proprietà digitali e su quante più fonti terze possibile. L'LLM triangola questi segnali e ne deriva un livello di confidenza nell'entità.

Cinque leve di entity building

  • sameAs cross-platform completo nello schema Organization: LinkedIn, GitHub, Crunchbase, Wikipedia (se applicabile), Wikidata, profili di settore verticali.
  • Citazioni coerenti del nome aziendale: NAP (Name, Address, Phone) identico ovunque, virgole e abbreviazioni incluse.
  • Pubblicazioni su testate terze del settore (Agenda Digitale, AI4Business, ZeroUno, IlSole24Ore Tecnologia): citazioni di terze parti pesano enormemente.
  • Profilo founder verificato con Person Schema collegato, presenza su podcast e conferenze di settore, articoli firmati.
  • Repository GitHub pubblici e attivi: per le software house è un segnale di autorevolezza tecnica che gli LLM leggono direttamente.
Misurazione

Come si misura la GEO (perché senza KPI non è ingegneria)

Se non puoi misurarla, non puoi migliorarla. La GEO ha KPI propri, diversi dalla SEO. Non basta guardare le posizioni in SERP: bisogna tracciare la presenza dentro le risposte generative, in ognuno dei principali motori.

KPI 01

Citation Rate

Percentuale di risposte LLM su query target che ti citano come fonte. Si misura su un set di query rilevanti (50-200 tipicamente) interrogate sistematicamente su ogni motore.

KPI 02

Share-of-Voice AI

Percentuale delle citazioni totali per il tuo topic che ti spettano, rispetto ai competitor. È l'equivalente della quota di mercato, ma misurata dentro le risposte generative invece che a fatturato.

KPI 03

Position in Citation List

Quando vieni citato, in che posizione appari fra le fonti listate? Primo, secondo, ultimo? La prima posizione è ovviamente preferibile: gli utenti cliccano di più sulle prime fonti citate, esattamente come in SERP.

KPI 04

Cross-Engine Coverage

In quanti motori LLM compari per le tue query target? ChatGPT, Perplexity, Gemini, Claude, eventualmente Mistral e DeepSeek. Una copertura su un solo motore è fragile; cross-engine è solida.

Tool di citation tracking

ToolCosa faPrezzo mensile
Otterly.aiCitation tracking multi-engine + analisi competitorda ~99$/mese
ProfoundEnterprise citation analytics, integrazioni customquotato (custom)
RankscaleMulti-engine tracking, alert su variazionida ~79$/mese
Manual promptingTest di 10 prompt critici a settimana su un foglio condiviso0€ (tempo interno)

Per iniziare basta il manual prompting. Scegli dieci query rilevanti per il tuo business, le chiedi a ChatGPT/Perplexity/Gemini ogni settimana, registri le risposte in un foglio. Bastano quattro settimane per avere baseline. Quando la baseline esiste, puoi decidere se vale la pena passare a un tool dedicato.

Crawl policy

Lasciare entrare i bot giusti

Il robots.txt va aggiornato esplicitamente per gli user-agent degli LLM. Un Allow esplicito è un segnale di consenso che gli LLM preferiscono rispetto al silenzio del file. Senza direttiva esplicita molti bot si comportano in modo conservativo e riducono la frequenza di crawling.

Esempio robots.txt esteso per LLM

User-agent: GPTBot
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: CCBot
Allow: /

Sitemap: https://example.com/sitemap.xml

Nota sulla scelta

Bloccare i bot LLM è una scelta legittima per contenuti premium, database riservati, editori a pagamento. Ma chi lo fa perde la possibilità di essere citato come fonte. È una scelta di trade-off, non una best practice universale. Per le aziende B2B italiane che vivono di lead generation, l'Allow esplicito è quasi sempre la decisione corretta.

Audit operativo

La checklist completa per il tuo audit GEO

Venti voci, divise in quattro macro-aree. Stampa, condividi con il team, segna come fatto solo ciò che è verificato in produzione. Non in staging, non in roadmap: in produzione.

Area 01

Tecnica

  • Server-side rendering attivo, HTML compilato al primo byte verificato con curl.
  • HTML semantico: article, section, h1-h6 coerenti, table per dati tabellari, dl per definizioni.
  • Core Web Vitals nel verde (LCP < 2.5s, INP < 200ms, CLS < 0.1) misurati su CrUX, non solo lab.
  • Robots.txt esteso con Allow esplicito per GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot.
  • llms.txt pubblicato in root, con header H1, descrizione one-liner e curated index gerarchico.

Area 02

Schema

  • Organization con sameAs completo (LinkedIn, GitHub, Crunchbase, profili settoriali), @id stabile.
  • Person founder collegata via worksFor all'Organization, con pagina autore dedicata.
  • Article su ogni pillar, con author, publisher, about, datePublished, dateModified aggiornata.
  • FAQPage su pagine con FAQ, con risposte 80-150 parole auto-conclusive.
  • BreadcrumbList su tutte le pagine interne, gerarchia coerente con la navigazione.

Area 03

Contenuti

  • Almeno tre pillar di 3000+ parole su topic core del business.
  • Ogni paragrafo con almeno un dato verificabile (numero, data, nome, percentuale).
  • Frasi auto-conclusive, citabili fuori dal contesto del paragrafo.
  • Date esplicite e aggiornate, nessun «recentemente», «negli ultimi anni», «da poco».
  • FAQ in formato standard, almeno 8-12 voci per pagina pillar, schema FAQPage replicato.

Area 04

Misurazione

  • Baseline di manual prompting su 10 query target, registrata su foglio condiviso.
  • Almeno un tool di citation tracking attivo (Otterly, Rankscale o equivalente).
  • Dashboard KPI condiviso con team marketing e prodotto, aggiornamento settimanale.
  • Calendario di refresh contenuti ogni sei mesi, con dateModified aggiornata di conseguenza.
  • Monitoring del sameAs cross-platform, alert su cambiamenti di profili linkati.

Vuoi la checklist in PDF stampabile?

Te la mandiamo gratis, senza newsletter automatica. La usi con il tuo team interno o con l'agenzia che ti segue.

Scarica la checklist PDF
FAQ

Domande frequenti su GEO

Le dodici domande che riceviamo più spesso da founder, marketing manager e CTO italiani. Risposte fact-dense, senza buzzword.

La GEO (Generative Engine Optimization) è la disciplina tecnica che ottimizza un sito affinché venga citato come fonte dalle risposte sintetiche prodotte dai motori generativi, in particolare ChatGPT, Perplexity, Gemini e Claude. Non sostituisce la SEO, la estende: la SEO punta al click sulla SERP, la GEO punta alla citazione dentro la risposta. Le leve sono diverse: server-side rendering, HTML semantico, schema.org concatenato per @id, llms.txt, contenuti fact-dense e construction esplicita di entità identificabili nel knowledge graph degli LLM.
La SEO ottimizza per i motori di ricerca tradizionali, il cui output sono dieci link blu e qualche feature SERP. L'AEO (Answer Engine Optimization) ottimizza per gli snippet diretti, come il featured snippet di Google o l'AI Overview, ed è un sottoinsieme operativo della GEO. La GEO è la categoria più larga: ottimizza per ogni motore generativo che produce una risposta sintetica multi-fonte. I KPI differiscono: posizione e CTR per la SEO, snippet capture rate per l'AEO, citation rate e share-of-voice AI per la GEO.
Sì, ma con comportamento variabile. ChatGPT con browsing attivo cita in media 6 fonti per risposta a query informazionali. Perplexity ne cita 8. Gemini AI Overview in Italia mostra fonti nel 30% circa delle SERP intercettate (dato 2026). Le citazioni appaiono come link cliccabili o come riferimenti numerati. Senza browsing, ChatGPT fa risposte generative senza citazioni esplicite, ma può comunque menzionare brand ed entità presenti nel suo training data — un'altra ragione per cui costruire entity SEO solida resta strategico.
Tre livelli, in ordine crescente di costo. Manual prompting: scegli 10 query critiche per il tuo business, le chiedi ogni settimana a ChatGPT, Perplexity, Gemini, Claude, e annoti le risposte in un foglio. Bastano quattro settimane per avere una baseline. Tool dedicati: Otterly.ai da circa 99$ al mese, Rankscale da circa 79$ al mese, Profound (enterprise, prezzo a quotazione). Server logs: filtra i visitatori provenienti da chat.openai.com, perplexity.ai, gemini.google.com — i referrer ti dicono quali risposte stanno generando traffico reale.
No, non è obbligatorio e non c'è una specifica IETF ufficiale. È uno standard emergente proposto su llmstxt.org. Però i principali crawler LLM stanno iniziando a leggerlo, e averlo è un segnale di intenzione esplicita: stai dicendo all'LLM quali sono i contenuti canonici del tuo dominio e in che ordine di priorità. Costa zero pubblicarlo. Va trattato come un curated index, non come un sitemap.xml: deve contenere solo le pagine che vuoi davvero che gli LLM trattino come fonte autoritativa.
Dipende dal modello di business. Bloccarli ha senso per editori a pagamento, banche dati riservate, contenuti premium dietro paywall. Per chiunque viva di lead generation, marketing inbound o brand awareness, bloccare significa scomparire dalle risposte LLM. È una scelta di trade-off, non una best practice universale. La nostra raccomandazione operativa per la stragrande maggioranza delle aziende B2B italiane è: lasciare entrare, monitorare le citazioni, accettare la perdita di click diretti come costo della nuova visibilità.
I tempi sono più lenti della SEO classica perché gli LLM aggiornano il loro knowledge cut-off periodicamente, non in tempo reale. Per ChatGPT e Claude i tempi di propagazione possono andare dalle 8 alle 24 settimane. Per Perplexity, che fa retrieval live, i risultati sono visibili in 2-4 settimane dopo la pubblicazione di un nuovo pillar. Per Gemini AI Overview, dipende dall'aggiornamento dell'indice Google: da 4 a 12 settimane. Una baseline misurabile in 4 settimane è realistica; un trend stabile in 6 mesi è realistico.
In Italia il mercato è ancora frammentato. Un audit GEO serio (analisi tecnica + entity audit + content audit + roadmap) parte da 4-8K€. Un retainer mensile per implementazione e content engineering è tipicamente 3-6K€ al mese per le PMI, 8-15K€ al mese per progetti enterprise. Diffidare di chi propone pacchetti sotto i 1.500€ al mese: la GEO richiede competenze cross fra SEO tecnica, schema engineering, content strategy e prompt-level testing che difficilmente si trovano sotto quella soglia.
Sì, di più di prima. Gli LLM leggono tutto, ma assegnano peso diverso a HTML semantico, microdati strutturati e prosa generica. Schema.org è il modo standard di dichiarare entità, relazioni e tipologie di contenuto. Per la GEO è fondamentale perché permette di costruire un knowledge graph esplicito concatenando Organization, Person, Article, FAQPage e BreadcrumbList tramite riferimenti @id. Senza schema gli LLM devono inferire le relazioni; con schema le ricevono dichiarate. Risultato pratico: più probabilità di essere citati come fonte autoritativa.
Sì, in modo netto. La maggior parte dei crawler LLM (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot) non esegue JavaScript, o lo esegue in modo limitato. Una single page application client-side che renderizza tutto in browser appare ai loro occhi come una shell vuota. Soluzione: server-side rendering o static site generation. Next.js con App Router, SvelteKit con SSR, Astro statico, Hugo, Eleventy: qualsiasi tecnologia che restituisca HTML compilato al primo byte. Il punto non è «niente JS», è «HTML semantico già pronto al primo byte».
Sì, WordPress è perfettamente compatibile con la GEO perché è server-side per natura. Le leve di intervento sono: plugin per schema.org strutturato (Rank Math o Yoast con configurazione manuale di Organization, Person, Article), inserimento manuale di llms.txt nella root, ottimizzazione dei contenuti in chiave fact-density, robots.txt esteso con allow esplicito per i bot LLM. Il problema su WordPress di solito non è il CMS, è il tema: temi page-builder pesanti possono peggiorare Core Web Vitals e contenuto semantico. In quel caso un refactor del tema è raccomandato.
Gli e-commerce hanno una superficie GEO diversa. Le query LLM tipiche sono comparative («qual è il miglior X sotto Y€?») o di scoperta («consigliami uno Z italiano»). Le leve specifiche sono: schema Product completo con offers, brand e aggregateRating, schema Review reale (non finto), schema FAQPage sulle pagine prodotto, sezioni comparative editoriali sulle categorie, glossario tecnico per costruire entità. La citation rate per gli e-commerce è più bassa rispetto agli editori, ma la conversione di chi clicca dalla risposta LLM è significativamente più alta — utenti già qualificati dalla risposta sintetica.
Audit GEO

Vuoi sapere se la tua app è citabile dagli LLM?

Facciamo un audit GEO gratuito di 30 minuti sul tuo dominio. Ti diciamo cosa manca, in ordine di impatto, in modo onesto. Niente sales pitch mascherato.

Federico Costa risponde personalmente entro 24h lavorative.