GEO (Generative Engine Optimization): cómo conseguir que la IA cite tu marca
Resumen ejecutivo GEO es optimizar para que ChatGPT, Perplexity, Gemini y los AI Overviews citen tu contenido, no solo para rankear en Google. No es «SEO para IA»: resuelve dos problemas distintos —entrar en el corpus recuperable y ser seleccionado en la síntesis— y casi todos optimizan uno. El famoso «+40%» del estudio académico que […]

Resumen ejecutivo
- GEO es optimizar para que ChatGPT, Perplexity, Gemini y los AI Overviews citen tu contenido, no solo para rankear en Google.
- No es «SEO para IA»: resuelve dos problemas distintos —entrar en el corpus recuperable y ser seleccionado en la síntesis— y casi todos optimizan uno.
- El famoso «+40%» del estudio académico que dio nombre a GEO mide una métrica concreta sobre un benchmark sintético, no es una ley universal.
- Sin entidad reconocida (Knowledge Graph, menciones, schema) ningún truco de formato te hace citable: la capa GEO es la última, no la primera.
- Estar indexado es obligatorio, pero el ranking clásico ya no es la puerta: el peso del top 10 en las citas de AI Overviews se desplomó en 2026.
GEO (Generative Engine Optimization, u optimización para motores generativos) es el conjunto de técnicas para aumentar la probabilidad de que un motor generativo —ChatGPT, Perplexity, Gemini, Claude o los AI Overviews de Google— incluya y cite tu contenido en la respuesta que sintetiza para un usuario. La definición es fácil. Lo que la mayoría de guías en español hace mal es lo que viene después: tratar GEO como «SEO con otro nombre», repetir un estudio sin contexto y dar consejos de formato a sitios que la IA ni siquiera reconoce. Este artículo desmonta esas tres cosas y deja una secuencia de trabajo que funciona.
En esta página
- Qué es GEO (Generative Engine Optimization)
- Los dos problemas que GEO resuelve (y que casi todos confunden)
- Por qué el «+40%» del estudio que todos citan está mal interpretado
- La entidad primero, el formato después
- La mecánica operativa: cómo estructurar contenido citable
- Cómo medir tu cuota de citación (o estás a ciegas)
- Errores comunes en GEO
- Preguntas frecuentes
Qué es GEO (Generative Engine Optimization)
GEO es la disciplina que optimiza tu contenido para ser citado dentro de una respuesta generada por IA, en lugar de para ocupar una posición en una lista de enlaces azules. Esa es toda la diferencia, y es enorme. En el SEO clásico, la unidad que compite es la página: tú peleas por el puesto 1 de la SERP. En un motor generativo, la unidad que compite es la afirmación: el modelo recupera varias fuentes, las sintetiza en una respuesta única y decide a cuáles atribuir cada frase. Puedes rankear primero y no ser citado. Puedes ni siquiera estar en el top 5 y aparecer en la respuesta. Las reglas no son las mismas.
El término fue formalizado académicamente en el paper «GEO: Generative Engine Optimization», publicado en KDD 2024 tras una primera versión en arXiv en 2023 (volvemos a ello en detalle más abajo). El mercado lo ha rodeado de un alfabeto de siglas que conviene ordenar antes de seguir. AEO, LLMO y GEO se solapan, y nadie en el sector se pone de acuerdo en las fronteras exactas. Esta es la separación operativa con la que trabajamos:
| Disciplina | Optimiza para | Unidad que compite | Resultado deseado |
|---|---|---|---|
| SEO | Buscadores clásicos (lista de enlaces) | La página / URL | Posición en la SERP |
| AEO (Answer Engine Optimization) | Respuestas directas (snippets, AI Overviews) | El párrafo-respuesta | Ser «la respuesta» |
| GEO (Generative Engine Optimization) | Motores generativos (síntesis con citas) | El fragmento citable | Ser citado en la respuesta generada |
| LLMO | Presencia de marca dentro del modelo | La entidad / marca | Que el modelo «sepa» quién eres |
En la práctica diaria estas capas se pisan. Un buen featured snippet (AEO) suele alimentar un AI Overview. Una marca que el modelo conoce (LLMO) tiene ventaja al ser seleccionada (GEO). Por eso preferimos no perder el tiempo discutiendo etiquetas y centrarnos en lo único que importa: que un humano haga una pregunta a una IA y tu nombre salga en la respuesta, con un enlace a tu sitio.
Los dos problemas que GEO resuelve (y que casi todos confunden)
GEO no es un problema, son dos, y son mecánicamente distintos. El primero es la recuperación: que tu contenido esté en el conjunto de documentos que el motor extrae para responder una consulta. El segundo es la selección: que, una vez recuperado, el modelo decida citarte en la respuesta. La inmensa mayoría de guías mezcla los dos y aplica soluciones del segundo a un sitio que falla en el primero. Es como pulir la presentación de un plato que nadie ha pedido a la cocina.
1. Entrar en el corpus recuperable
Los motores generativos con búsqueda en vivo —AI Overviews, Perplexity, el modo búsqueda de ChatGPT— funcionan con RAG (generación aumentada por recuperación): lanzan una búsqueda, recuperan las fuentes más relevantes y sintetizan la respuesta sobre ellas. Si no estás en ese conjunto recuperado, no puedes ser citado. Punto. Y ese conjunto arranca en el índice de búsqueda: si Google decide no indexar tu contenido, la conversación sobre GEO ni siquiera empieza. Estar indexado es el suelo innegociable.
Lo que ha cambiado —y casi nadie en español ha actualizado— es el peso del ranking clásico. A mediados de 2025, alrededor del 76% de las páginas citadas en AI Overviews también rankeaban en el top 10 para esa consulta. Un análisis de Ahrefs de 2026 sobre 863.000 keywords y cuatro millones de URLs lo desploma hasta cerca del 38%, con aproximadamente un tercio de las citas procedente de páginas que ni siquiera están en el top 100. Dicho de otra forma: en 2026, ranking de Google y motor de citación están en buena medida desacoplados. La causa probable es el query fan-out (Google descompone la consulta en subconsultas y cita páginas que cubren bien ese clúster), reforzado por el cambio a Gemini 3 como modelo por defecto. La investigación académica ya formaliza esta separación entre selección y absorción de citas. La consecuencia práctica no es que el SEO deje de importar, sino que importa distinto: ser recuperable y cubrir el tema en profundidad pesa más que aferrarse a una sola posición número uno.
Conviene distinguir dos formas de «estar en el corpus». Una es la recuperación en vivo (RAG), que es el caso habitual hoy y se influye con SEO técnico y autoridad. La otra es la memoria paramétrica: lo que el modelo «sabe» sin buscar, fruto de su entrenamiento. Esa segunda capa se mueve mucho más despacio y depende de tu ubicuidad y consistencia en toda la web. No se optimiza con un artículo; se construye siendo, de forma sostenida, una referencia que aparece en muchos sitios fiables.
2. Ser seleccionado en la síntesis
Una vez recuperado, el modelo elige a quién atribuir cada frase. Aquí —y solo aquí— es donde el formato y la extractabilidad mueven la aguja. Los motores prefieren pasajes que respondan la pregunta completos y por sí solos, lo que varios análisis de 2026 describen como el predictor más fuerte de cita: la «isla de respuesta», un fragmento que tiene sentido aislado del resto del artículo. Si rankeas primero pero entierras la respuesta bajo tres párrafos de introducción, el modelo recupera tu página y cita la de otro que respondió en la primera frase.
El error que vemos una y otra vez nace de confundir las dos capas. Hay quien aplica tácticas de selección (añadir estadísticas, reescribir párrafos) a un sitio que no se recupera ni se reconoce: trabajo perdido. Y hay quien clava la recuperación (posición 1) pero diluye la respuesta y nunca lo seleccionan. Necesitas las dos. La tabla mental es simple: si no apareces en ninguna respuesta de IA, sospecha de la recuperación; si apareces a veces pero te citan poco frente a competidores que rankean peor, el problema es la selección.
Por qué el «+40%» del estudio que todos citan está mal interpretado
El estudio que dio nombre a este campo es real y serio, pero el «+40%» que circula por LinkedIn está descontextualizado hasta volverse engañoso. Si vas a citar investigación, cítala bien; es, irónicamente, una de las cosas que el propio estudio premia.
Nota de autoridad. Lo que sigue describe y contextualiza investigación publicada y revisada (KDD 2024), no afirmaciones propias. La cifra de mejora es específica de una métrica y de un benchmark concretos; tratarla como un porcentaje universal de «más tráfico» o «más citas en producción» es un error de lectura. La fuente primaria está enlazada al final.
El paper, titulado «GEO: Generative Engine Optimization» (Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan y Deshpande; Princeton, IIT Delhi, Georgia Tech y el Allen Institute for AI), introdujo GEO-bench, un benchmark de 10.000 consultas en varios dominios, y probó nueve modificaciones de contenido sobre un motor generativo que imitaba a Bing Chat, validando los mejores resultados en Perplexity. ¿Qué encontró? Que métodos como añadir estadísticas, añadir citas textuales y citar fuentes mejoraban su métrica de visibilidad hasta alrededor de un 41%, mientras que el keyword stuffing de toda la vida no servía de nada. Hasta aquí, bien.
El problema es lo que la gente hace con ese número. Cuatro matices que casi nadie menciona:
- Es una métrica concreta, no tráfico. El «+40%» se mide sobre un «Position-Adjusted Word Count» (cuánto de tu fuente aparece, ponderado por posición), no sobre clics, conversiones ni siquiera número de citas en un motor real.
- Es un benchmark sintético de 2023. Se midió sobre un motor que imitaba a Bing Chat de hace dos años. Los motores de 2026 —AI Overviews, ChatGPT, Perplexity, Gemini— han cambiado; los resultados no se transfieren uno a uno.
- Varía mucho por dominio. El propio paper subraya que la eficacia depende del sector. Un «+40% de media» esconde dominios donde apenas hace nada.
- Solo mide la capa de selección. Asume que tu fuente ya fue recuperada. No dice absolutamente nada sobre cómo entrar en el conjunto recuperado, que es el problema difícil para la mayoría.
La lección direccional es válida: cita fuentes, aporta datos reales, escribe con autoridad y claridad. Eso encaja con lo que vemos en producción. Pero «añade estadísticas y sube un 40%» como garantía es pensamiento mágico. Y aquí está la ironía cruel: una generación entera de contenido GEO está inventando estadísticas para gamificar este hallazgo. Spoiler: falla. Los datos falsos no sobreviven a la verificación factual de los motores, hunden tu E-E-A-T y, en sectores regulados, son directamente un riesgo legal. El filtrado de documentación de Google de 2024 dejó ver señales compatibles con la detección de esfuerzo y originalidad del contenido (los famosos contentEffort y OriginalContentScore): rellenar de cifras inventadas no es una ventaja, es una huella.
La entidad primero, el formato después
Antes de optimizar un solo párrafo, el motor tiene que reconocer tu marca como una entidad. Sin eso, estás puliendo el adorno de un fantasma. Esta es la tesis que más se ignora y la que más resultados da: en GEO, la secuencia importa, y la capa de formato es la última, no la primera.
Una entidad, en este contexto, es algo que el sistema «sabe que existe» y con lo que asocia atributos consistentes: quién eres, a qué te dedicas, dónde, con qué autoridad. Eso vive en el Knowledge Graph y se construye con Entity SEO. La investigación apunta en la misma dirección que la intuición: análisis de la Medill School (Northwestern) señalan que el reconocimiento de marca y la profundidad temática influyen en qué fuentes selecciona un AI Overview. Y los modelos entrenados sobre la web «conocen» a las entidades que aparecen de forma consistente y autorizada; a las marcas oscuras las resumen de forma genérica o, sencillamente, las omiten.
Construir la entidad
Las palancas son concretas y poco glamurosas. Schema de Organization y Person con sameAs apuntando a perfiles reales. Consistencia de NAP (nombre, dirección, teléfono) en toda la web. Presencia en los corpus que los modelos citan: Reddit y Wikipedia son, de lejos, los dominios más citados por ChatGPT, seguidos de plataformas como LinkedIn y YouTube. Autoría real y verificable —una persona con credenciales y experiencia de primera mano— en lugar de «el equipo de redacción». Menciones y enlaces de terceros que corroboren tu existencia. Nada de esto sale en un artículo titulado «10 trucos de GEO», porque no es un truco: es reputación digital, medida por máquinas.
Solo entonces, el formato citable
Cuando ya eres una entidad reconocida que rankea, el trabajo de extractabilidad empieza a rendir. No antes. Formatear el contenido de un sitio sin entidad es optimizar el último 10% del problema mientras ignoras el 90%. Por eso una de las novedades de 2026 es tan reveladora: Google ha empezado a extender sus «Preferred Sources» (fuentes preferidas) a los AI Overviews y al modo IA, con despliegue en junio. La señal de entidad definitiva no es un schema: es un humano eligiendo tu marca en sus ajustes para que se la prioricen. Cuando el propio usuario te elige, has ganado la partida antes de que el algoritmo decida nada.
La mecánica operativa: cómo estructurar contenido citable
Una vez eres una entidad que rankea, ser citable se reduce a una cosa: que cada afirmación valiosa se pueda extraer aislada y verificar. Estas son las tácticas que aplicamos, en orden de impacto:
- Chunks autoconclusivos. Cada sección y cada párrafo responden su pregunta sin depender del contexto anterior. Es el predictor más fuerte de cita. Y encaja con el cambio de comportamiento: las consultas en IA tienden a ser más conversacionales y específicas que las búsquedas clásicas de Google. Responde la pregunta completa que hace el usuario, no una keyword suelta.
- Definición explícita «X es Y» al principio. Los modelos extraen definiciones literales. (Este artículo abre cada H2 con la respuesta directa por exactamente esta razón.)
- Datos reales con fuente citada. Las estadísticas verificables suben la probabilidad de cita. Reales, no inventadas: la verificación factual penaliza el dato falso, y el contenido caduca —cuando tus cifras o entidades envejecen, te caes de las citas aunque sigas rankeando.
- Estructura escaneada. H2/H3 que reflejan preguntas, tablas comparativas, listas y FAQ. Los motores sintetizan a partir de estas estructuras. El schema de FAQ, HowTo y Article sigue siendo base; ImageObject y VideoObject ganan peso para la selección multimodal.
- Responde la pregunta y las tres siguientes. Cobertura semántica completa de la intención (el llamado query fan-out), no relleno. Eso es autoridad temática real, y en español funciona distinto que el concepto anglosajón.
- Autoría y E-E-A-T visibles. Autor real, credenciales, experiencia de primera mano. En 2026, la «E» de Experience se ha vuelto el principal desempate cuando dos fuentes tienen los mismos datos.
Y, por simetría, lo que conviene tener claro:
| Qué hacer | Qué no hacer |
|---|---|
| Responder en la primera frase de cada sección | Enterrar la respuesta bajo una introducción narrativa |
| Citar datos reales con su fuente | Inventar estadísticas para «subir el +40%» |
| Construir la entidad antes que el formato | Optimizar párrafos de un sitio que la IA no reconoce |
| Escribir contenido claro que sirve a humanos y a máquinas | Reescribir todo «en dialecto para IA» |
Falta el invitado incómodo: llms.txt. Se vende como la llave de la cita en IA y no lo es. La guía de Google de mayo de 2026 dice de forma explícita que no hace falta para AI Overviews ni para el modo IA, y lo agrupa con el «chunking artificial» y el schema especial como tácticas que no ayudan a su visibilidad. Gary Illyes ya había confirmado en julio de 2025 que Google no lo soporta ni piensa hacerlo, y John Mueller lo comparó con la difunta meta etiqueta de keywords. Empíricamente, los crawlers de respuesta (GPTBot, ClaudeBot, PerplexityBot) apenas lo leen: en una muestra de OtterlyAI, solo el 0,1% del tráfico de bots de IA tocó el archivo. Sí tiene sentido como infraestructura para agentes (Anthropic lo recomienda para documentación técnica, OpenAI lo usa en su SDK de agentes): un llms.txt mínimo es un experimento barato si tienes casos de uso de agentes. Pero no es un canal de citación, y no es lo mismo que IndexNow, que sirve a Bing y Yandex —no a Google— para avisar de URLs nuevas. Confundirlos es el primer síntoma de que alguien ha leído titulares, no documentación.
Cómo medir tu cuota de citación (o estás a ciegas)
Si no mides tu cuota de citación en cada motor, no estás haciendo GEO: estás escribiendo y rezando. Y medirlo bien empieza por aceptar una verdad incómoda: no hay un Search Console para esto. Las citas en AI Overviews varían por consulta, ubicación y dispositivo, y las respuestas de un LLM son probabilísticas. Lo que se mide es una muestra, no un censo. Cualquiera que te prometa un número exacto y estable miente o no entiende la herramienta que vende.
El método pragmático que seguimos tiene cuatro pasos. Primero, definir un set de prompts representativo: las preguntas reales que hacen tus compradores, en su lenguaje conversacional (no tus keywords). Segundo, muestrear en los motores que importan a tu audiencia. En B2B mandan ChatGPT y Perplexity; en consumo, los AI Overviews por volumen. Como referencia de hacia dónde va el tráfico: según datos de OtterlyAI de 2026, ChatGPT concentra alrededor del 56% del tráfico de referencia de IA, Gemini un 18% y Perplexity un 8%. Tercero, seguir la evolución en el tiempo: tasa de mención, tasa de cita, cuota de voz frente a competidores y —clave— qué URLs concretas se citan. Cuarto, cerrar el círculo con los logs del servidor (GA4 filtra muchas visitas de bots de IA) y el tráfico de referencia desde fuentes de IA.
Sobre herramientas, sin afiliados ni humo: en el extremo enterprise, Profound cubre diez o más motores e integra logs; Otterly.AI es la opción asequible para empezar con ChatGPT y Perplexity y cuota de voz; Peec AI, Scrunch AI o el módulo de IA de Semrush completan el mapa. La nueva generación añade recomendaciones (qué páginas reescribir, qué schema falta) sobre el tracking. Aviso: una herramienta que solo mide ChatGPT ya se queda corta. Por nuestra parte, consultamos las APIs de Perplexity y OpenAI contra sets de prompts específicos de cada cliente para medir su cuota de citación; los resultados varían por proyecto y no publicamos cifras de escaparate, porque un número sacado de contexto sería exactamente el tipo de dato inventado que criticamos tres secciones más arriba.
Errores comunes en GEO
- Optimizar el formato sin tener entidad. Pulir párrafos de un sitio que el motor ni recupera ni reconoce. Es el error número uno y el más caro en tiempo.
- Inventar estadísticas para gamificar el «+40%». Los datos falsos fallan la verificación factual, dañan el E-E-A-T y son un riesgo legal en sectores regulados. Mala idea por triplicado.
- Confundir llms.txt con un canal de citación. Los bots de respuesta lo ignoran y Google dice explícitamente que no hace falta. Como infraestructura para agentes vale; como GEO, no.
- Tratar GEO como «SEO con otro nombre» y reescribir todo «para IA». Buen contenido es buen contenido: pasajes claros que sirven a personas y a máquinas, no un dialecto separado para robots.
- No medir, o medir un solo motor. Si solo miras ChatGPT, ignoras Gemini y los AI Overviews (en torno al 18% del referral) y a Perplexity.
- Ignorar el contenido caducado. Datos y entidades que envejecen te sacan de las citas aunque rankees. Mantener el contenido vivo es parte del trabajo, no un extra.
- Perseguir el truco del mes. Schema spam, keyword stuffing reciclado en otra capa. Los motores rerankean por relevancia y autoridad. Lo que penalizaba en SEO penaliza aquí.
Preguntas frecuentes
¿GEO sustituye al SEO?
No, pero la relación ha cambiado. Necesitas estar indexado y ser recuperable, aunque en 2026 el peso del top 10 clásico en las citas de AI Overviews se ha desplomado (de ~76% en 2025 a ~38%, según Ahrefs): la cobertura temática pesa más que mantener una sola posición. GEO añade la capa de ser citado; no reemplaza una base SEO sana.
¿Cuánto tarda GEO en dar resultados?
Depende de tu punto de partida como entidad. Si ya rankeas y tu marca es reconocida, semanas. Si partes de cero, es construcción de autoridad de varios meses. No hay atajo verificable.
¿Necesito un archivo llms.txt para que la IA me cite?
No para las citas. Google confirmó en mayo de 2026 que no lo usa para AI Overviews ni para el modo IA, y los crawlers de respuesta apenas lo leen. Solo tiene sentido como infraestructura para agentes.
¿Funciona añadir estadísticas, como dice el estudio de Princeton?
Ayuda, pero solo con datos reales y verificables. Inventar cifras falla la verificación factual y es un riesgo, especialmente en sectores regulados. La mejora del estudio es además específica de una métrica y un benchmark concretos.
¿Qué motor importa más?
Depende de tu audiencia. En B2B mandan ChatGPT y Perplexity; en consumo, los AI Overviews de Google por volumen. Como referencia, ChatGPT concentra alrededor del 56% del tráfico de referencia de IA.
¿Puedo medir si la IA me cita?
Sí, pero por muestreo, no con certeza absoluta: las respuestas varían por consulta, ubicación y dispositivo. Se usan sets de prompts representativos y herramientas de tracking multi-motor.
¿El contenido generado con IA penaliza en GEO?
No por ser de IA, sino por ser genérico. Lo que penaliza es la falta de originalidad y esfuerzo. El contenido sin valor propio rara vez se cita, lo escriba quien lo escriba.
Para seguir
Si quieres el contexto técnico que sostiene este artículo, el análisis del leak y NavBoost explica las señales de autoridad que mencionamos, y la pieza sobre indexación cubre el prerrequisito de recuperación. Para entender el método con el que aplicamos todo esto a un nicho, está el Método A.U.T.O.R.I.D.A.D., y el glosario tiene fichas vivas de GEO y AEO.
Fuentes
- Aggarwal, P., Murahari, V., Rajpurohit, T., Kalyan, A., Narasimhan, K. y Deshpande, A. — «GEO: Generative Engine Optimization», ACM SIGKDD (KDD 2024); primera versión en arXiv, 2023. arxiv.org/abs/2311.09735. Consulta 2026-06.
- Google Search Central — Documentación sobre las funciones de IA en la Búsqueda y guía de optimización (mayo 2026). developers.google.com/search/docs. Consulta 2026-06.
- Ahrefs, recogido por Search Engine Journal — Análisis de 863.000 keywords y 4 millones de URLs de AI Overviews que documenta la caída de las citas procedentes del top 10 (≈76% en 2025 → ≈38% en 2026). searchenginejournal.com. Consulta 2026-06.
- Yu, J. et al. — «From Citation Selection to Citation Absorption: A Measurement Framework for Generative Engine Optimization Across AI Search Platforms», arXiv (2026). arxiv.org/abs/2604.25707. Consulta 2026-06.
- OtterlyAI — Investigación 2026 sobre tráfico de referencia de IA y uso de llms.txt por crawlers. otterly.ai. Consulta 2026-06.
- Northwestern Medill — Investigación sobre reconocimiento de marca y profundidad temática en la selección de fuentes de AI Overviews. Consulta 2026-06.
Sobre el autor
Federico Noya es fundador de AutoridadDigital.com, agencia española de SEO y GEO. Lleva años ayudando a despachos, clínicas y empresas B2B a pasar de invisibles a ser la marca que la IA cita.
¿Te cita la IA, o cita a tu competencia?
Medimos tu cuota de citación real en ChatGPT, Perplexity y los AI Overviews, y te decimos qué hace falta para entrar en la respuesta. Sin promesas de «+40%».
FOUNDER & SEO LEAD
Founder de Autoridad Digital. Especialista en SEO, Generative Engine Optimization, Topical Authority y Authority Stacking, PR Digital. Todos los artículos del blog están firmados por él.