URL Extractor Online
Extraia todas as URLs de qualquer texto ou código-fonte instantaneamente.
Por que usar
Descubra todos os links em segundos
HTTP e HTTPS
Detecta URLs com ambos os esquemas, incluindo portas, caminhos, query strings e fragmentos.
100% privado
Seu texto nunca sai do navegador. Ideal para código-fonte e dados internos.
Sem duplicatas
Deduplicação automática. Cada URL aparece apenas uma vez no resultado.
Instantâneo
Extração em milissegundos, independentemente do tamanho do texto ou HTML.
Como funciona
Três passos, sem complicação
Cole seu texto ou HTML
Cole o conteúdo do qual você deseja extrair URLs: texto simples, código HTML, respostas de API, logs.
Extração automática
O extrator detecta todas as URLs com http e https, incluindo query strings, fragmentos e caracteres codificados.
Copie a lista de URLs
Obtenha a lista de URLs sem duplicatas, uma por linha, pronta para análise ou auditoria.
Perguntas frequentes
Ficou com dúvidas?
O extrator detecta URLs com os esquemas http:// e https://. O padrão inclui o domínio com subdomínios, caminho, parâmetros de query string (após o ponto de interrogação) e fragmentos (após o sustenido). Também detecta URLs com portas explícitas e caracteres codificados em URL como %20 e %2F. URLs sem esquema (apenas o domínio e caminho) não são detectadas para evitar falsos positivos em textos comuns.
As query strings são incluídas por completo no resultado. Os fragmentos de URL também são preservados. Caracteres codificados por porcentagem conforme o RFC 3986, como %20 para espaço e %2F para barra, são mantidos como aparecem no texto. Isso é importante para URLs de APIs REST que contêm parâmetros com valores complexos.
Sim. O extrator compara as URLs completas, incluindo query strings e fragmentos, para determinar duplicatas. Duas URLs apontando para o mesmo recurso mas com query strings diferentes são consideradas distintas. A comparação é sensível a maiúsculas no caminho, mas insensível no domínio, conforme o RFC 3986.
Para extrair URLs de uma página web: 1) No Chrome ou Firefox, pressione Ctrl+U (ou Cmd+U no Mac) para ver o código-fonte da página. 2) Selecione tudo com Ctrl+A e copie. 3) Cole no extrator. Isso captura todas as URLs em atributos href, src, action e data-*, além de URLs em comentários e scripts. Para páginas com JavaScript dinâmico, use a aba Rede das ferramentas de desenvolvedor para capturar as requisições reais realizadas.
Os casos de uso mais comuns são: auditorias de SEO para encontrar todos os links de uma página, detecção de links quebrados comparando as URLs extraídas com respostas HTTP, análise de logs de servidor para ver quais URLs são mais solicitadas, extração de fontes de recursos (imagens, scripts, estilos) de páginas HTML, análise de sitemaps XML, verificação de URLs em documentação técnica e coleta de fontes para scraping estruturado.
A estrutura de URLs segundo o RFC 3986 e a análise de links em SEO
A estrutura das URLs (Uniform Resource Locators) é definida pelo RFC 3986 (Uniform Resource Identifier: Generic Syntax), publicado em 2005. A especificação define os componentes: esquema (http, https, ftp), autoridade (usuario:senha@host:porta), caminho, query e fragmento. O RFC 3986 também define a codificação por porcentagem para representar caracteres não permitidos diretamente nas URLs. É uma evolução do RFC 2396 (1998) e do RFC 1738 (1994), o primeiro RFC a definir o formato de URL.
A distinção entre URI, URL e URN é frequentemente confundida. Uma URI (Uniform Resource Identifier) é o conceito mais amplo: identifica um recurso. Uma URL (Uniform Resource Locator) é uma URI que também especifica como acessar o recurso (inclui o esquema de acesso como http://). Uma URN (Uniform Resource Name) é uma URI que identifica um recurso pelo nome em um namespace, como ISBN ou DOI. Na prática, os termos URL e URI são usados de forma intercambiável no contexto web, embora tecnicamente as URLs sejam um subconjunto das URIs.
A análise de links é uma técnica fundamental de SEO. Rastreadores como o Googlebot extraem URLs das páginas para descobrir novos conteúdos. O PageRank, o algoritmo original do Google patenteado em 1998, valoriza páginas pela quantidade e qualidade dos links que recebem. Ferramentas como Screaming Frog, Ahrefs e Semrush baseiam parte de sua funcionalidade na extração massiva de URLs de páginas web para construir grafos de links que permitem analisar a estrutura de autoridade de um site.