DokumenteBilderMedienPDF-Werkzeuge

Unicode-Escape-Konverter Online

Text in Unicode-Escape-Sequenzen umwandeln und zurück – in deinem Browser.

In deinem Browser verarbeitet — kein Text wird an einen Server gesendet

Unicode-Text ↔ Escape-Sequenzen

JSON- und JS-Formate

Generiert \uXXXX-Escapes, die mit JSON, Java, C# und JavaScript ES5 kompatibel sind, oder das neue \u{} aus ES6.

100% privat

Kodierung und Dekodierung erfolgen in deinem Browser. Keine Daten verlassen dein Gerät.

Emoji-Unterstützung

Verarbeitet korrekt UTF-16-Ersatzzeichenpaare und Codepunkte außerhalb des BMP (Emojis, erweitertes einheitliches CJK).

Sofortig

Ergebnisse werden in Echtzeit aktualisiert, während du tippst oder Inhalt einfügst.

Drei Schritte, kein Aufwand

1

Text oder Escapes eingeben

Füge den Text ein, den du in Unicode-Escapes umwandeln möchtest (wie \u0048\u0065\u006C\u006C\u006F), oder füge die Escape-Sequenzen ein, die du zurück in lesbaren Text dekodieren möchtest.

2

Konvertierungsmodus wählen

Wähle Text → Escape zum Kodieren oder Escape → Text zum Dekodieren. Du kannst zwischen dem Format \uXXXX (BMP) und \u{XXXXX} (ES6, unterstützt Emojis und Zeichen außerhalb des BMP) wählen.

3

Ergebnis kopieren

Das Ergebnis erscheint in Echtzeit. Verwende die Kopieren-Schaltfläche, um es in deine Zwischenablage zu übernehmen.

Noch Fragen?

Das sind textuelle Darstellungen von Unicode-Zeichen, die nur ASCII-Zeichen verwenden. Das Format \uXXXX stellt einen Unicode-Codepunkt mit vier hexadezimalen Ziffern dar (deckt den BMP ab, die ersten 65.536 Zeichen). Beispiel: \u0041 = A, \u00E9 = é, \u4E2D = 中. Sie werden verwendet, wenn das Zielsystem Nicht-ASCII-Zeichen nicht direkt unterstützt.

\uXXXX ist das klassische Format, das den BMP abdeckt (U+0000 bis U+FFFF). Es funktioniert in JSON, Java, C#, JavaScript ES5 und Python. \u{XXXXX} ist das erweiterte ES6-Format (ECMAScript 2015), das jeden Unicode-Codepunkt unterstützt, einschließlich Zeichen außerhalb des BMP wie Emojis. Verwende es, wenn du Kompatibilität mit ergänzenden Zeichen in modernem JavaScript benötigst.

JSON erfordert, dass Dateien ASCII oder UTF-8 sind, erlaubt aber \uXXXX-Escapes zur Darstellung beliebiger Zeichen. Das garantiert Interoperabilität, wenn der Kommunikationskanal Unicode nicht gut verarbeitet. In JavaScript sind Escapes bei Zeichenketten mit problematischen Zeichen, in regulären Ausdrücken und wenn Quellcode aufgrund von Systemanforderungen reines ASCII sein muss, nützlich.

Emojis und viele zusätzliche asiatische Zeichen liegen außerhalb des BMP (U+10000 bis U+10FFFF). Im Format \uXXXX werden sie als Ersatzzeichenpaare (Surrogate Pairs) dargestellt: zwei aufeinanderfolgende \uXXXX-Werte. Mit \u{...} in ES6 wird die Verwirrung durch Ersatzzeichenpaare vermieden und der direkte Codepunkt verwendet.

Bei der Internationalisierung (i18n) erforderten Java-.properties-Dateien historisch, dass Nicht-ASCII-Zeichen im Format \uXXXX vorliegen. Das Tool native2ascii konvertierte Dateien mit nativen Zeichen in dieses Format. Seit Java 9 unterstützen .properties-Dateien UTF-8 direkt. Dennoch pflegen viele Legacy-Projekte das Escape-Format, und dieser Konverter erleichtert die Arbeit damit erheblich.

Unicode: Geschichte (1991), UTF-8-Kodierung und Escapes in Programmiersprachen

Unicode wurde geschaffen, um das Chaos inkompatibler Kodierungen zu lösen: ASCII (1963, nur 128 Zeichen), Latin-1, Big5, Shift-JIS, KOI8-R... Jede Region verwendete ihr eigenes System. Das Unicode-Konsortium wurde 1988 gegründet und veröffentlichte 1991 die erste Version des Standards mit dem Ziel, jedem Zeichen aller Schriftsysteme der Welt eine eindeutige Nummer (Codepunkt) zuzuweisen. Unicode 15.1 definiert derzeit über 149.000 Zeichen.

UTF-8, entworfen von Ken Thompson und Rob Pike im Jahr 1992, wurde dank seiner ASCII-Kompatibilität und Effizienz für westlichen Text zur dominierenden Kodierung im Internet. 2008 überholte es Latin-1 als am häufigsten verwendete Kodierung im Web, und seit 2012 ist es die Kodierung von über 90% aller Webseiten. Die \uXXXX-Escape-Sequenzen ermöglichen es, jedes Unicode-Zeichen innerhalb reiner ASCII-Zeichenketten darzustellen.

Jede moderne Programmiersprache hat ihre eigene Unicode-Escape-Syntax: Python verwendet \uXXXX und \UXXXXXXXX, Java und C# verwenden \uXXXX, JavaScript ES5 verwendet \uXXXX mit Ersatzzeichenpaaren für das erweiterte BMP, ES6 führte \u{XXXXX} ein, und Rust verwendet \u{XXXXX}. JSON-Dateien müssen UTF-8 sein und erlauben \uXXXX für jedes Zeichen, was diesen Konverter besonders nützlich macht, wenn man mit internationalisierten APIs oder Konfigurationsdateien arbeitet.