Генератор robots.txt Онлайн

Генерируйте файл robots.txt для вашего сайта — с проверкой правил.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Зачем это нужно

robots.txt для управления индексацией

Все роботы

Правила для Googlebot, Bingbot и других поисковых систем.

Без интернета

Генерация в браузере без отправки данных на сервер.

Валидация

Инструмент проверяет синтаксис и предупреждает о распространённых ошибках.

Мгновенно

Файл генерируется сразу при выборе правил.

Как это работает

Три шага — никаких сложностей

Выберите правила

Укажите, каким поисковым роботам разрешён или запрещён доступ к каким разделам сайта.

Добавьте Sitemap

Укажите URL sitemap для ускорения индексации поисковыми системами.

Скачайте robots.txt

Получите готовый файл и разместите его в корне вашего сайта.

FAQ

Остались вопросы?

Что такое robots.txt?

robots.txt — текстовый файл в корне сайта, содержащий инструкции для поисковых роботов согласно Robots Exclusion Protocol (REP). Он указывает, какие части сайта роботы могут или не могут сканировать. Файл должен быть доступен по адресу https://yourdomain.com/robots.txt.

Запрещает ли robots.txt индексацию страниц?

Нет. robots.txt запрещает сканирование (crawling), но не гарантирует отсутствие страницы в индексе. Если на заблокированную страницу ведут внешние ссылки, Google может добавить её в индекс без сканирования. Для предотвращения индексации используйте мета-тег noindex или заголовок X-Robots-Tag.

Как указать конкретного робота?

User-agent: * применяется ко всем роботам. Для конкретного робота используйте его имя: User-agent: Googlebot (только Google), User-agent: Bingbot (только Bing), User-agent: GPTBot (ChatGPT), User-agent: anthropic-ai (Claude). Правила для конкретного агента имеют приоритет над правилами для *.

Обязаны ли роботы соблюдать robots.txt?

Добросовестные роботы (Googlebot, Bingbot, DuckDuckBot) соблюдают robots.txt. Вредоносные боты и скраперы могут игнорировать эти правила. Для защиты от нежелательного доступа используйте аутентификацию и WAF (Web Application Firewall).

Какой синтаксис поддерживает расширенный robots.txt?

Стандарт REP (RFC 9309, 2022) определяет базовые правила. Расширения: Crawl-delay (задержка между запросами), Sitemap (URL карты сайта). Google поддерживает * и $ в Disallow-путях. Allow директива является нестандартным, но широко поддерживаемым расширением Googlebot.