Generador de Robots.txt

Genera un robots.txt correcto y evita errores de rastreo que afecten tu SEO.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Procesado en tu navegador

Por qué importa

El robots.txt correcto protege tu SEO

Sin errores de sintaxis

Genera un archivo válido con la sintaxis exacta que los buscadores esperan.

Evita desindexaciones

Configura reglas correctas para no bloquear accidentalmente CSS, JS o páginas importantes.

Incluye directiva Sitemap

Añade la URL de tu sitemap para que Googlebot descubra tu contenido más rápido.

Sin registro

Genera y descarga tu robots.txt sin crear ninguna cuenta.

Cómo funciona

Tres pasos, sin complicaciones

Configura tus reglas

Elige los bots (Googlebot, Bingbot, todos) y define qué rutas permitir o bloquear. Añade la URL de tu sitemap si tienes uno.

Previsualiza el archivo

El generador construye el robots.txt en tiempo real. Revisa que las reglas sean exactamente las que necesitas.

Descarga y sube a tu servidor

Copia el contenido o descarga el archivo. Súbelo a la raíz de tu dominio como /robots.txt.

Preguntas frecuentes

¿Tienes dudas?

¿Qué es robots.txt?

Robots.txt es un archivo de texto plano que los sitios web colocan en su directorio raíz para indicar a los rastreadores de buscadores (bots) qué páginas o secciones no deben visitar. Fue propuesto por Martijn Koster en 1994 como parte del Robots Exclusion Standard, una convención informal adoptada rápidamente por todos los buscadores principales. Google, Bing, Yahoo y prácticamente todos los bots respetan este archivo de forma voluntaria.

¿Bloquear en robots.txt impide la indexación?

No. Este es el error más frecuente. Robots.txt controla el rastreo (crawling), no la indexación. Un buscador puede indexar una URL bloqueada en robots.txt si encuentra enlaces a ella desde otras páginas. Para impedir la indexación de verdad, debes usar la meta etiqueta <meta name='robots' content='noindex'> o el encabezado HTTP X-Robots-Tag: noindex en la propia página.

¿Cuáles son los errores más comunes en robots.txt?

Los más habituales son: (1) bloquear archivos CSS y JavaScript — esto impide que Googlebot renderice tus páginas correctamente y puede perjudicar el posicionamiento; (2) usar robots.txt para ocultar páginas con información sensible — no es un mecanismo de seguridad; (3) sintaxis incorrecta (mayúsculas, espacios extra) — el archivo es sensible a mayúsculas/minúsculas en las rutas; (4) no añadir la directiva Sitemap, que ayuda a los buscadores a descubrir tu contenido.

¿Qué directivas específicas entiende Google?

Google respeta las directivas estándar User-agent, Disallow y Allow, más algunas extensiones propias: Crawl-delay (aunque Google lo ignora oficialmente y prefiere ajustar la tasa de rastreo desde Search Console), la directiva Sitemap (para declarar la URL del sitemap XML), y el comodín * en rutas. Google también lee el encabezado HTTP X-Robots-Tag para instrucciones a nivel de documento, incluyendo en recursos no HTML como PDFs e imágenes.

¿Para qué sirve la directiva Sitemap en robots.txt?

La directiva Sitemap: https://example.com/sitemap.xml dentro de robots.txt le indica a los rastreadores dónde encontrar el sitemap XML del sitio. Es un método de descubrimiento complementario al registro en Google Search Console. Puedes declarar múltiples sitemaps en el mismo robots.txt. Aunque no es parte del estándar original de 1994, todos los buscadores principales la reconocen.