robots.txt-Generator Online

Korrekte robots.txt generieren und Crawling-Fehler vermeiden, die deiner SEO schaden.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Warum das wichtig ist

Die korrekte robots.txt schützt dein SEO

Keine Syntaxfehler

Erstelle eine gültige Datei mit der genauen Syntax, die Suchmaschinen erwarten.

De-Indexierung vermeiden

Korrekte Regeln konfigurieren, damit du nicht versehentlich CSS, JS oder wichtige Seiten blockierst.

Sitemap-Direktive inklusive

Füge deine Sitemap-URL hinzu, damit Googlebot deinen Inhalt schneller entdeckt.

Keine Anmeldung

robots.txt generieren und herunterladen ohne Konto erstellen.

So funktioniert es

Drei Schritte, kein Aufwand

Regeln konfigurieren

Wähle die Bots (Googlebot, Bingbot, alle) und definiere, welche Pfade erlaubt oder verboten sind. Füge deine Sitemap-URL hinzu, falls vorhanden.

Datei in der Vorschau prüfen

Der Generator erstellt die robots.txt in Echtzeit. Überprüfe, ob die Regeln genau deinen Anforderungen entsprechen.

Herunterladen und auf deinen Server hochladen

Kopiere den Inhalt oder lade die Datei herunter. Lade sie als /robots.txt in das Stammverzeichnis deiner Domain hoch.

FAQ

Noch Fragen?

Was ist robots.txt?

Robots.txt ist eine Nur-Text-Datei, die Websites in ihrem Stammverzeichnis ablegen, um Suchmaschinen-Crawlern (Bots) mitzuteilen, welche Seiten oder Bereiche sie nicht besuchen sollen. Sie wurde 1994 von Martijn Koster als Teil des Robots Exclusion Standard vorgeschlagen, einer informellen Konvention, die schnell von allen großen Suchmaschinen übernommen wurde. Google, Bing, Yahoo und praktisch alle Bots respektieren diese Datei freiwillig.

Verhindert eine Blockierung in robots.txt die Indexierung?

Nein. Das ist das häufigste Missverständnis. Robots.txt steuert das Crawling, nicht die Indexierung. Eine Suchmaschine kann eine in robots.txt blockierte URL indexieren, wenn sie Links dazu von anderen Seiten findet. Um die Indexierung wirklich zu verhindern, muss der Meta-Tag meta name=robots content=noindex oder der HTTP-Header X-Robots-Tag: noindex auf der Seite selbst verwendet werden.

Was sind die häufigsten robots.txt-Fehler?

Die häufigsten Fehler sind: (1) CSS- und JavaScript-Dateien blockieren – das verhindert, dass Googlebot deine Seiten korrekt rendert und kann die Rankings verschlechtern; (2) robots.txt zum Verstecken von Seiten mit sensiblen Informationen verwenden – es ist kein Sicherheitsmechanismus; (3) fehlerhafte Syntax (Groß-/Kleinschreibungsfehler, zusätzliche Leerzeichen) – die Datei ist für Pfade case-sensitive; (4) fehlende Sitemap-Direktive, die Suchmaschinen dabei hilft, deine Inhalte zu entdecken.

Welche Google-spezifischen Direktiven unterstützt robots.txt?

Google respektiert die Standard-Direktiven User-agent, Disallow und Allow sowie einige Erweiterungen: Crawl-delay (obwohl Google dies offiziell ignoriert und es vorzieht, die Crawl-Rate über die Search Console anzupassen), die Sitemap-Direktive (zur Angabe der XML-Sitemap-URL) und den Platzhalter * in Pfaden. Google liest auch den HTTP-Header X-Robots-Tag für Anweisungen auf Dokumentenebene, einschließlich für Nicht-HTML-Ressourcen wie PDFs und Bilder.

Wozu dient die Sitemap-Direktive in robots.txt?

Die Direktive Sitemap: https://example.com/sitemap.xml innerhalb von robots.txt teilt Crawlern mit, wo sie die XML-Sitemap der Website finden. Es ist eine Entdeckungsmethode, die die Registrierung in der Google Search Console ergänzt. Du kannst mehrere Sitemaps in derselben robots.txt deklarieren. Obwohl nicht Teil des ursprünglichen Standards von 1994, wird sie von allen großen Suchmaschinen erkannt.