Generatore robots.txt Online

Genera un robots.txt corretto ed evita gli errori di crawling che danneggiano la tua SEO.

Sitemap URL

User-agent: *
Disallow:

Sitemap: https://example.com/sitemap.xml

Processed in your browser

Perche e importante

Il robots.txt corretto protegge la tua SEO

Nessun errore di sintassi

Genera un file valido con la sintassi esatta che i motori di ricerca si aspettano.

Evita la de-indicizzazione

Configura regole corrette per non bloccare accidentalmente CSS, JS o pagine importanti.

Include la direttiva Sitemap

Aggiungi l'URL del tuo sitemap affinche Googlebot scopra il tuo contenuto piu rapidamente.

Nessuna registrazione

Genera e scarica il tuo robots.txt senza creare alcun account.

Come funziona

Tre passaggi, senza complicazioni

Configura le tue regole

Scegli i bot (Googlebot, Bingbot, tutti) e definisci quali percorsi permettere o vietare. Aggiungi l'URL del tuo sitemap se ne hai uno.

Visualizza l'anteprima del file

Il generatore costruisce il robots.txt in tempo reale. Verifica che le regole siano esattamente quelle che ti servono.

Scarica e carica sul tuo server

Copia il contenuto o scarica il file. Caricalo nella radice del tuo dominio come /robots.txt.

FAQ

Hai delle domande?

Cos'e robots.txt?

Robots.txt e un file di testo che i siti web inseriscono nella loro directory radice per indicare ai crawler dei motori di ricerca (bot) quali pagine o sezioni non devono visitare. Fu proposto da Martijn Koster nel 1994 come parte del Robots Exclusion Standard, una convenzione informale rapidamente adottata da tutti i principali motori di ricerca. Google, Bing, Yahoo e praticamente tutti i bot rispettano volontariamente questo file.

Bloccare in robots.txt impedisce l'indicizzazione?

No. Questo e il malinteso piu diffuso. Robots.txt controlla il crawling, non l'indicizzazione. Un motore di ricerca puo indicizzare un URL bloccato in robots.txt se trova link ad esso da altre pagine. Per impedire davvero l'indicizzazione, devi usare il tag con attributo name robots e contenuto noindex, oppure l'intestazione HTTP X-Robots-Tag: noindex sulla pagina stessa.

Quali sono gli errori piu comuni in robots.txt?

I piu frequenti sono: (1) bloccare file CSS e JavaScript: questo impedisce a Googlebot di renderizzare correttamente le tue pagine e puo penalizzare il ranking; (2) usare robots.txt per nascondere pagine con informazioni sensibili: non e un meccanismo di sicurezza; (3) sintassi errata (errori di maiuscole, spazi in eccesso): il file e case-sensitive per i percorsi; (4) non aggiungere la direttiva Sitemap, che aiuta i motori di ricerca a scoprire il tuo contenuto.

Quali direttive specifiche di Google supporta robots.txt?

Google rispetta le direttive standard User-agent, Disallow e Allow, piu alcune estensioni: Crawl-delay (sebbene Google la ignori ufficialmente e preferisca regolare il tasso di crawl tramite Search Console), la direttiva Sitemap (per dichiarare l'URL del sitemap XML) e il carattere jolly * nei percorsi. Google legge anche l'intestazione HTTP X-Robots-Tag per le istruzioni a livello di documento, incluso su risorse non HTML come PDF e immagini.

A cosa serve la direttiva Sitemap in robots.txt?

La direttiva Sitemap: https://example.com/sitemap.xml all'interno di robots.txt indica ai crawler dove trovare il sitemap XML del sito. E un metodo di scoperta complementare alla registrazione in Google Search Console. Puoi dichiarare piu sitemap nello stesso robots.txt. Sebbene non facesse parte dello standard originale del 1994, tutti i principali motori di ricerca la riconoscono.