URL Extractor

Extrahiere alle URLs aus beliebigem Text oder Quellcode sofort.

In deinem Browser verarbeitet — kein Text wird an einen Server gesendet

Warum du es nutzen solltest

Alle Links in Sekunden entdecken

HTTP und HTTPS

Erkennt URLs mit beiden Schemas, einschließlich Ports, Pfade, Query-Strings und Fragmente.

100 % privat

Dein Text verlässt den Browser nie. Ideal für Quellcode und interne Daten.

Keine Duplikate

Automatische Deduplizierung. Jede URL erscheint nur einmal im Ergebnis.

Sofortig

Extraktion in Millisekunden, unabhängig von der Text- oder HTML-Länge.

So funktioniert es

Drei Schritte, kein Aufwand

Füge deinen Text oder HTML ein

Füge den Inhalt ein, aus dem du URLs extrahieren möchtest: Klartext, HTML-Code, API-Antworten, Protokolle.

Automatische Extraktion

Das Werkzeug erkennt alle http- und https-URLs, einschließlich Query-Strings, Fragmenten und kodierten Zeichen.

Kopiere die URL-Liste

Erhalte die deduplizierte URL-Liste, eine pro Zeile, bereit für Analysen oder Prüfungen.

FAQ

Noch Fragen?

Welche URL-Muster werden erkannt?

Das Werkzeug erkennt URLs mit http://- und https://-Schemas. Das Muster umfasst die Domain mit Subdomains, den Pfad, Query-String-Parameter (nach ?) und Fragmente (nach #). Es erkennt auch URLs mit expliziten Ports (https://example.com:8080/pfad) und URL-kodierten Zeichen (%20, %2F usw.). URLs ohne Schema (example.com/pfad) werden nicht erkannt, um falsch-positive Ergebnisse in regulärem Text zu vermeiden.

Wie werden Query-Strings, Fragmente und kodierte Zeichen verarbeitet?

Query-Strings (https://example.com/suche?q=Begriff&page=2) werden vollständig ins Ergebnis aufgenommen. URL-Fragmente (https://example.com/dok#abschnitt) werden ebenfalls beibehalten. Prozent-kodierte Zeichen gemäß RFC 3986, wie %20 für Leerzeichen und %2F für Schrägstrich, bleiben so erhalten, wie sie im Text erscheinen. Das ist wichtig für REST-API-URLs mit Parametern, die komplexe Werte enthalten.

Werden Duplikate automatisch entfernt?

Ja. Das Werkzeug vergleicht vollständige URLs einschließlich Query-Strings und Fragmenten, um Duplikate zu bestimmen. Zwei URLs, die auf dieselbe Ressource zeigen, aber unterschiedliche Query-Strings haben, gelten als unterschiedlich (https://example.com?id=1 und https://example.com?id=2 sind verschiedene URLs). Der Vergleich ist pfadsensitiv für Groß- und Kleinschreibung, aber nicht für die Domain, gemäß RFC 3986.

Wie extrahiere ich Links von einer HTML-Seite?

Um URLs von einer Webseite zu extrahieren: 1) Drücke in Chrome/Firefox Strg+U (oder Cmd+U auf dem Mac), um den Seitenquellcode anzuzeigen. 2) Wähle alles mit Strg+A aus und kopiere es. 3) Füge es in das Werkzeug ein. Damit werden alle URLs in href-, src-, action- und data-*-Attributen erfasst, plus URLs in Kommentaren und Skripten. Für Seiten mit dynamischem JavaScript kannst du den Netzwerk-Tab der Entwicklertools verwenden.

Was sind typische Anwendungsfälle für den URL-Extraktor?

Die häufigsten Anwendungsfälle sind: SEO-Audits zum Finden aller Links auf einer Seite, Erkennung defekter Links durch Vergleich extrahierter URLs mit HTTP-Antworten, Serverprotokoll-Analyse um zu sehen welche URLs am häufigsten angefragt werden, Extrahieren von Ressourcenquellen (Bilder, Skripte, Stile) aus HTML-Seiten, XML-Sitemap-Analyse, URL-Überprüfung in technischer Dokumentation und Quellensammlung für strukturiertes Scraping.