Generator robots.txt Online

Generuj poprawny plik robots.txt i unikaj błędów indeksowania szkodzących Twojemu SEO.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Dlaczego to ważne

Poprawny plik robots.txt chroni Twoje SEO

Bez błędów składni

Generuj prawidłowy plik z dokładną składnią, jakiej oczekują wyszukiwarki.

Unikaj deindeksowania

Konfiguruj właściwe reguły, aby nie zablokować przypadkowo CSS, JS ani ważnych stron.

Zawiera dyrektywę Sitemap

Dodaj URL mapy witryny, aby Googlebot szybciej odkrywał Twoje treści.

Bez rejestracji

Generuj i pobieraj robots.txt bez tworzenia żadnego konta.

Jak to działa

Trzy kroki, żadnych komplikacji

Skonfiguruj reguły

Wybierz boty (Googlebot, Bingbot, wszystkie) i zdefiniuj ścieżki do zezwolenia lub zablokowania. Dodaj URL mapy witryny, jeśli ją posiadasz.

Wyświetl podgląd pliku

Generator buduje plik robots.txt w czasie rzeczywistym. Sprawdź, czy reguły są dokładnie takie, jakich potrzebujesz.

Pobierz i wgraj na serwer

Skopiuj zawartość lub pobierz plik. Wgraj go do katalogu głównego swojej domeny jako /robots.txt.

FAQ

Masz pytania?

Czym jest robots.txt?

Robots.txt to plik tekstowy, który witryny umieszczają w swoim katalogu głównym, aby poinformować crawlery wyszukiwarek (boty), których stron lub sekcji nie powinny odwiedzać. Został zaproponowany przez Martijona Kostera w 1994 roku jako część Robots Exclusion Standard, nieformalnej konwencji szybko przyjętej przez wszystkie główne wyszukiwarki. Google, Bing, Yahoo i praktycznie wszystkie boty dobrowolnie respektują ten plik.

Czy blokowanie w robots.txt zapobiega indeksowaniu?

Nie. To najczęstsze nieporozumienie. Robots.txt kontroluje indeksowanie (crawling), a nie indeksowanie (indexing). Wyszukiwarka może zindeksować URL zablokowany w robots.txt, jeśli znajdzie do niego linki z innych stron. Aby naprawdę zapobiec indeksowaniu, musisz użyć tagu <meta name='robots' content='noindex'> lub nagłówka HTTP X-Robots-Tag: noindex na samej stronie.

Jakie są najczęstsze błędy robots.txt?

Najczęstsze to: (1) blokowanie plików CSS i JavaScript — to uniemożliwia Googlebotowi poprawne renderowanie Twoich stron i może zaszkodzić pozycjom w wynikach; (2) używanie robots.txt do ukrywania stron z wrażliwymi informacjami — to nie jest mechanizm bezpieczeństwa; (3) nieprawidłowa składnia (błędy wielkości liter, dodatkowe spacje) — plik uwzględnia wielkość liter dla ścieżek; (4) brak dyrektywy Sitemap, która pomaga wyszukiwarkom odkrywać Twoje treści.

Jakie dyrektywy specyficzne dla Google obsługuje robots.txt?

Google respektuje standardowe dyrektywy User-agent, Disallow i Allow, a ponadto kilka rozszerzeń: Crawl-delay (choć Google oficjalnie go ignoruje, preferując dostosowanie częstości indeksowania przez Search Console), dyrektywę Sitemap (do deklarowania URL mapy witryny XML) i symbol wieloznaczny * w ścieżkach. Google odczytuje również nagłówek HTTP X-Robots-Tag dla instrukcji na poziomie dokumentu, w tym dla zasobów innych niż HTML, takich jak PDF-y i obrazy.

Jakie jest zastosowanie dyrektywy Sitemap w robots.txt?

Dyrektywa Sitemap: https://example.com/sitemap.xml wewnątrz robots.txt informuje crawlery, gdzie znaleźć mapę witryny XML. Jest to metoda odkrywania komplementarna wobec rejestracji w Google Search Console. Możesz deklarować wiele map witryny w tym samym robots.txt. Choć nie jest częścią oryginalnego standardu z 1994 roku, wszystkie główne wyszukiwarki ją rozpoznają.