Gerador robots.txt Online

Gere um robots.txt correto e evite erros de rastreamento que prejudicam seu SEO.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Por que é importante

Um robots.txt correto protege seu SEO

Sem erros de sintaxe

Gere um arquivo válido com a sintaxe exata que os mecanismos de busca esperam.

Evite desindexação

Configure regras corretas para não bloquear acidentalmente CSS, JS ou páginas importantes.

Inclui a diretiva Sitemap

Adicione a URL do seu sitemap para o Googlebot descobrir seu conteúdo mais rápido.

Sem cadastro

Gere e baixe seu robots.txt sem criar nenhuma conta.

Como funciona

Três passos, sem complicação

Configure suas regras

Escolha os bots (Googlebot, Bingbot, todos) e defina quais caminhos permitir ou bloquear. Adicione a URL do seu sitemap se você tiver um.

Visualize o arquivo

O gerador constrói o robots.txt em tempo real. Revise se as regras são exatamente o que você precisa.

Baixe e envie para o seu servidor

Copie o conteúdo ou baixe o arquivo. Faça o upload na raiz do seu domínio como /robots.txt.

Perguntas frequentes

Ficou com dúvidas?

O que é robots.txt?

Robots.txt é um arquivo de texto simples que os sites colocam no diretório raiz para informar aos rastreadores de mecanismos de busca (bots) quais páginas ou seções eles não devem visitar. Foi proposto por Martijn Koster em 1994 como parte do Robots Exclusion Standard, uma convenção informal adotada rapidamente por todos os principais mecanismos de busca. Google, Bing, Yahoo e praticamente todos os bots respeitam voluntariamente esse arquivo.

Bloquear no robots.txt impede a indexação?

Não. Esse é o equívoco mais comum. O robots.txt controla o rastreamento, não a indexação. Um mecanismo de busca pode indexar uma URL bloqueada no robots.txt se encontrar links para ela em outras páginas. Para realmente impedir a indexação, você deve usar a tag meta name='robots' content='noindex' ou o cabeçalho HTTP X-Robots-Tag: noindex na própria página.

Quais são os erros mais comuns no robots.txt?

Os mais frequentes são: (1) bloquear arquivos CSS e JavaScript, o que impede o Googlebot de renderizar suas páginas corretamente e pode prejudicar o ranking; (2) usar o robots.txt para ocultar páginas com informações sensíveis, pois ele não é um mecanismo de segurança; (3) sintaxe incorreta (erros de maiúsculas, espaços extras), pois o arquivo diferencia maiúsculas de minúsculas nos caminhos; (4) não adicionar a diretiva Sitemap, que ajuda os mecanismos de busca a descobrir seu conteúdo.

Quais diretivas específicas do Google o robots.txt suporta?

O Google respeita as diretivas padrão User-agent, Disallow e Allow, além de algumas extensões: Crawl-delay (embora o Google a ignore oficialmente e prefira ajustar a taxa de rastreamento pelo Search Console), a diretiva Sitemap (para declarar a URL do sitemap XML) e o curinga * nos caminhos. O Google também lê o cabeçalho HTTP X-Robots-Tag para instruções no nível do documento, inclusive em recursos que não são HTML, como PDFs e imagens.

Qual é o objetivo da diretiva Sitemap no robots.txt?

A diretiva Sitemap: https://exemplo.com/sitemap.xml dentro do robots.txt informa aos rastreadores onde encontrar o sitemap XML do site. É um método de descoberta complementar ao cadastro no Google Search Console. Você pode declarar vários sitemaps no mesmo robots.txt. Embora não faça parte do padrão original de 1994, todos os principais mecanismos de busca a reconhecem.