DocumentosImágenesMediaHerramientas PDF

Convertir Unicode Escape

Convierte texto a secuencias de escape Unicode y viceversa en tu navegador.

Procesado en tu navegador — ningún texto se envía a servidores

Texto Unicode ↔ secuencias de escape

Formatos JSON y JS

Genera escapes \uXXXX compatibles con JSON, Java, C# y JavaScript ES5, o el nuevo \u{} de ES6.

100% privado

La codificación y decodificación ocurren en tu navegador. Ningún dato abandona tu dispositivo.

Soporte de emojis

Maneja correctamente los pares sustitutos de UTF-16 y los puntos de código fuera del BMP (emojis, CJK unificado extendido).

Instantáneo

El resultado se actualiza en tiempo real mientras escribes o pegas el contenido.

Tres pasos, sin complicaciones

1

Introduce tu texto o escapes

Pega el texto que quieres convertir a escapes Unicode (como \u0048\u0065\u006C\u006C\u006F), o pega las secuencias de escape que quieres decodificar a texto legible.

2

Selecciona el modo de conversión

Elige 'Texto → Escape' para codificar o 'Escape → Texto' para decodificar. Puedes elegir entre el formato \uXXXX (BMP) y \u{XXXXX} (ES6, soporta emojis y caracteres fuera del BMP).

3

Copia el resultado

El resultado aparece en tiempo real. Usa el botón de copiar para llevarlo al portapapeles.

¿Tienes dudas?

Son representaciones textuales de caracteres Unicode usando solo caracteres ASCII. El formato \uXXXX representa un código Unicode con cuatro dígitos hexadecimales (cubre el BMP, los primeros 65536 caracteres). Ejemplo: \u0041 = 'A', \u00E9 = 'é', \u4E2D = '中'. Se usan cuando el sistema de destino no soporta caracteres no-ASCII directamente.

\uXXXX es el formato clásico que cubre el BMP (U+0000 a U+FFFF). Funciona en JSON, Java, C#, JavaScript ES5 y Python. \u{XXXXX} es el formato extendido de ES6 (ECMAScript 2015) que soporta cualquier punto de código Unicode, incluyendo caracteres fuera del BMP como emojis (🎉 = \u{1F389}). Úsalo cuando necesites compatibilidad con caracteres suplementarios en JavaScript moderno.

JSON exige que los archivos sean ASCII o UTF-8, pero permite escapes \uXXXX para representar cualquier carácter. Esto garantiza la interoperabilidad cuando el canal de comunicación no soporta bien Unicode. En JavaScript, los escapes son útiles en strings con caracteres problemáticos, en expresiones regulares y cuando el código fuente debe ser ASCII puro por requisitos del sistema.

Los emojis y muchos caracteres asiáticos adicionales están fuera del BMP (U+10000 a U+10FFFF). En el formato \uXXXX se representan como pares sustitutos: dos valores \uXXXX consecutivos. Por ejemplo, 🎉 = \uD83C\uDF89. Esto es lo que JavaScript ES5 generaba internamente. Con \u{1F389} (ES6) se evita la confusión de los pares sustitutos y se usa el código directo.

En internacionalización (i18n), los archivos de propiedades de Java (.properties) históricamente requerían que los caracteres no-ASCII estuvieran en formato \uXXXX. La herramienta native2ascii convertía archivos con caracteres nativos a este formato. Desde Java 9, los archivos .properties soportan UTF-8 directamente. Aun así, muchos proyectos legados mantienen el formato de escape y este conversor facilita trabajar con ellos.

Unicode: historia (1991), codificación UTF-8 y escapes en lenguajes de programación

Unicode fue creado para resolver el caos de encodings incompatibles: ASCII (1963, solo 128 caracteres), Latin-1, Big5, Shift-JIS, KOI8-R... cada región usaba su propio sistema. El Consorcio Unicode se formó en 1988 y publicó la primera versión del estándar en 1991, con el objetivo de asignar un número único (punto de código) a cada carácter de todos los sistemas de escritura del mundo. Actualmente Unicode 15.1 define más de 149,000 caracteres.

UTF-8, diseñado por Ken Thompson y Rob Pike en 1992, se convirtió en la codificación dominante en Internet gracias a su compatibilidad con ASCII y su eficiencia para texto occidental. En 2008 superó a Latin-1 como la codificación más usada en la web, y desde 2012 es la codificación de más del 90% de todas las páginas web. Las secuencias de escape \uXXXX permiten representar cualquier carácter Unicode dentro de strings ASCII puras.

Cada lenguaje de programación moderno tiene su propia sintaxis de escape Unicode: Python usa \uXXXX y \UXXXXXXXX, Java y C# usan \uXXXX, JavaScript ES5 usa \uXXXX con pares sustitutos para el BMP extendido, ES6 introdujo \u{XXXXX}, y Rust usa \u{XXXXX}. Los archivos JSON deben ser UTF-8 y permiten \uXXXX para cualquier carácter, lo que hace especialmente útil este conversor cuando se trabaja con APIs o archivos de configuración internacionalizados.