DocumentsImagesMédiasOutils PDF

Unicode Escape en Ligne

Convertis du texte en séquences d'échappement Unicode et inversement dans ton navigateur.

Traité dans votre navigateur — aucun texte envoyé à un serveur

Texte Unicode vers séquences d'échappement

Formats JSON et JS

Génère des échappements \uXXXX compatibles avec JSON, Java, C# et JavaScript ES5, ou le nouveau \u{} d'ES6.

100 % privé

L'encodage et le décodage se font dans ton navigateur. Aucune donnée ne quitte ton appareil.

Prise en charge des emojis

Gère correctement les paires de substitution UTF-16 et les points de code hors BMP (emojis, CJK unifié étendu).

Instantané

Les résultats se mettent à jour en temps réel pendant que tu tapes ou colles du contenu.

Trois étapes, sans complications

1

Saisis ton texte ou tes échappements

Colle le texte à convertir en échappements Unicode (comme \u0048\u0065\u006C\u006C\u006F), ou colle les séquences d'échappement à décoder en texte lisible.

2

Sélectionne le mode de conversion

Choisis Texte vers Échappement pour encoder ou Échappement vers Texte pour décoder. Tu peux choisir entre le format \uXXXX (BMP) et \u{XXXXX} (ES6, prend en charge les emojis et les caractères hors BMP).

3

Copie le résultat

Le résultat apparaît en temps réel. Utilise le bouton copier pour le mettre dans ton presse-papiers.

Des questions ?

Ce sont des représentations textuelles de caractères Unicode n'utilisant que des caractères ASCII. Le format \uXXXX représente un point de code Unicode avec quatre chiffres hexadécimaux (couvre le BMP, les 65 536 premiers caractères). Exemple : \u0041 = A, \u00E9 = é, \u4E2D = le caractère chinois. Elles sont utilisées quand le système cible ne prend pas directement en charge les caractères non-ASCII.

\uXXXX est le format classique couvrant le BMP (U+0000 à U+FFFF). Il fonctionne dans JSON, Java, C#, JavaScript ES5 et Python. \u{XXXXX} est le format étendu d'ES6 (ECMAScript 2015) qui prend en charge n'importe quel point de code Unicode, y compris les caractères hors BMP comme les emojis (par exemple \u{1F389}). Utilise-le quand tu as besoin de la compatibilité avec des caractères supplémentaires en JavaScript moderne.

JSON exige que les fichiers soient en ASCII ou UTF-8 mais permet les échappements \uXXXX pour représenter n'importe quel caractère. Cela garantit l'interopérabilité quand le canal de communication ne gère pas bien Unicode. En JavaScript, les échappements sont utiles dans les chaînes avec des caractères problématiques, dans les expressions régulières et quand le code source doit être en ASCII pur pour des raisons système.

Les emojis et de nombreux caractères asiatiques supplémentaires se trouvent hors du BMP (U+10000 à U+10FFFF). Au format \uXXXX ils sont représentés par des paires de substitution : deux valeurs \uXXXX consécutives. Par exemple, l'emoji feux d'artifice vaut \uD83C\uDF89. C'est ce que JavaScript ES5 générait en interne. Avec \u{1F389} (ES6), la confusion des paires de substitution est évitée et le point de code direct est utilisé.

En internationalisation (i18n), les fichiers .properties Java exigeaient historiquement que les caractères non-ASCII soient au format \uXXXX. L'outil native2ascii convertissait les fichiers avec des caractères natifs dans ce format. Depuis Java 9, les fichiers .properties prennent en charge UTF-8 directement. De nombreux projets historiques maintiennent cependant le format d'échappement, et ce convertisseur facilite le travail avec eux.

Unicode : histoire (1991), encodage UTF-8 et échappements dans les langages de programmation

Unicode a été créé pour résoudre le chaos des encodages incompatibles : ASCII (1963, seulement 128 caractères), Latin-1, Big5, Shift-JIS, KOI8-R... chaque région utilisait son propre système. Le Consortium Unicode a été formé en 1988 et a publié la première version du standard en 1991, avec l'objectif d'attribuer un numéro unique (point de code) à chaque caractère de tous les systèmes d'écriture du monde. Unicode 15.1 définit actuellement plus de 149 000 caractères.

UTF-8, conçu par Ken Thompson et Rob Pike en 1992, est devenu l'encodage dominant sur Internet grâce à sa compatibilité avec ASCII et son efficacité pour le texte occidental. En 2008 il a dépassé Latin-1 comme encodage le plus utilisé sur le web, et depuis 2012 c'est l'encodage de plus de 90 % de toutes les pages web. Les séquences d'échappement \uXXXX permettent de représenter n'importe quel caractère Unicode dans des chaînes ASCII pures.

Chaque langage de programmation moderne a sa propre syntaxe d'échappement Unicode : Python utilise \uXXXX et \UXXXXXXXX, Java et C# utilisent \uXXXX, JavaScript ES5 utilise \uXXXX avec des paires de substitution pour le BMP étendu, ES6 a introduit \u{XXXXX}, et Rust utilise \u{XXXXX}. Les fichiers JSON doivent être en UTF-8 et permettent \uXXXX pour n'importe quel caractère, ce qui rend ce convertisseur particulièrement utile pour les API ou fichiers de configuration internationalisés.