Générateur robots.txt en Ligne

Génère un robots.txt correct et évite les erreurs de crawl qui nuisent à ton SEO.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Pourquoi c'est important

Le bon robots.txt protège ton SEO

Sans erreurs de syntaxe

Génère un fichier valide avec la syntaxe exacte attendue par les moteurs de recherche.

Évite les déindexations

Configure des règles correctes pour ne pas bloquer accidentellement les CSS, JS ou les pages importantes.

Inclut la directive Sitemap

Ajoute l'URL de ton sitemap pour que Googlebot découvre ton contenu plus vite.

Sans inscription

Génère et télécharge ton robots.txt sans créer de compte.

Comment ça marche

Trois étapes, sans complications

Configure tes règles

Choisis les bots (Googlebot, Bingbot, tous) et définis quels chemins autoriser ou interdire. Ajoute l'URL de ton sitemap si tu en as un.

Prévisualise le fichier

Le générateur construit le robots.txt en temps réel. Vérifie que les règles correspondent exactement à ce dont tu as besoin.

Télécharge et publie sur ton serveur

Copie le contenu ou télécharge le fichier. Dépose-le à la racine de ton domaine sous /robots.txt.

FAQ

Des questions ?

Qu'est-ce que robots.txt ?

Robots.txt est un fichier texte que les sites web placent à la racine de leur répertoire pour indiquer aux robots d'exploration des moteurs de recherche (bots) quelles pages ou sections ils ne doivent pas visiter. Il a été proposé par Martijn Koster en 1994 dans le cadre du Robots Exclusion Standard, une convention informelle rapidement adoptée par tous les grands moteurs de recherche. Google, Bing, Yahoo et pratiquement tous les bots respectent volontairement ce fichier.

Bloquer dans robots.txt empêche-t-il l'indexation ?

Non. C'est l'erreur la plus répandue. Robots.txt contrôle le crawl, pas l'indexation. Un moteur de recherche peut indexer une URL bloquée dans robots.txt s'il trouve des liens vers elle depuis d'autres pages. Pour vraiment empêcher l'indexation, tu dois utiliser la balise meta robots avec la valeur noindex ou l'en-tête HTTP X-Robots-Tag: noindex sur la page elle-même.

Quelles sont les erreurs les plus courantes dans robots.txt ?

Les plus fréquentes sont : (1) bloquer les fichiers CSS et JavaScript — cela empêche Googlebot de rendre tes pages correctement et peut nuire au positionnement ; (2) utiliser robots.txt pour masquer des pages avec des informations sensibles — ce n'est pas un mécanisme de sécurité ; (3) une syntaxe incorrecte (majuscules, espaces superflus) — le fichier est sensible à la casse pour les chemins ; (4) ne pas ajouter la directive Sitemap, qui aide les moteurs de recherche à découvrir ton contenu.

Quelles directives spécifiques Google reconnaît-il dans robots.txt ?

Google respecte les directives standard User-agent, Disallow et Allow, plus quelques extensions : Crawl-delay (bien que Google l'ignore officiellement et préfère ajuster le taux de crawl via Search Console), la directive Sitemap (pour déclarer l'URL du sitemap XML) et le joker * dans les chemins. Google lit également l'en-tête HTTP X-Robots-Tag pour les instructions au niveau du document, y compris sur les ressources non HTML comme les PDFs et les images.

À quoi sert la directive Sitemap dans robots.txt ?

La directive Sitemap: https://example.com/sitemap.xml à l'intérieur de robots.txt indique aux robots où trouver le sitemap XML du site. C'est une méthode de découverte complémentaire à l'enregistrement dans Google Search Console. Tu peux déclarer plusieurs sitemaps dans le même robots.txt. Bien qu'elle ne fasse pas partie du standard original de 1994, tous les grands moteurs de recherche la reconnaissent.