Конвертер Unicode Escape Онлайн

Конвертируйте текст в Unicode-последовательности и обратно прямо в браузере.

Обработано в вашем браузере — текст не отправляется на серверы

Для чего это нужно

Unicode-текст ↔ escape-последовательности

Форматы JSON и JS

Генерирует \uXXXX-escapes, совместимые с JSON, Java, C# и JavaScript ES5, или новый формат \u{} из ES6.

100% приватно

Кодирование и декодирование происходят в вашем браузере. Данные не покидают устройство.

Поддержка эмодзи

Корректно обрабатывает суррогатные пары UTF-16 и кодовые точки за пределами BMP (эмодзи, расширенный CJK).

Мгновенно

Результат обновляется в реальном времени по мере ввода или вставки текста.

Как это работает

Три шага — никаких сложностей

Введите текст или escape-последовательности

Вставьте текст, который нужно закодировать в Unicode-escapes (например, \u0048\u0065\u006C\u006C\u006F), или вставьте escape-последовательности, чтобы декодировать их обратно в читаемый текст.

Выберите направление конвертации

Выберите режим "Текст → Escape" для кодирования или "Escape → Текст" для декодирования. Доступны формат \uXXXX (BMP) и \u{XXXXX} (ES6, поддерживает эмодзи и символы за пределами BMP).

Скопируйте результат

Результат появляется в режиме реального времени. Используйте кнопку копирования, чтобы сохранить его в буфер обмена.

FAQ

Остались вопросы?

Что такое Unicode escape-последовательности?

Это текстовые представления Unicode-символов с использованием только ASCII-символов. Формат \uXXXX обозначает кодовую точку Unicode четырьмя шестнадцатеричными цифрами (охватывает BMP — первые 65536 символов). Примеры: \u0041 = 'A', \u00E9 = 'é', \u4E2D = '中'. Используются, когда целевая система не поддерживает символы вне ASCII напрямую.

В чём разница между \u и \u{}?

\uXXXX — классический формат, охватывающий BMP (U+0000 до U+FFFF). Работает в JSON, Java, C#, JavaScript ES5 и Python. \u{XXXXX} — расширенный формат ES6 (ECMAScript 2015), поддерживающий любую кодовую точку Unicode, включая символы за пределами BMP, такие как эмодзи (🎉 = \u{1F389}). Используйте его, когда нужна совместимость с дополнительными символами в современном JavaScript.

Зачем Unicode-escapes применяются в JSON и JavaScript?

JSON требует кодировки ASCII или UTF-8, но допускает \uXXXX для представления любого символа. Это гарантирует совместимость, когда канал передачи не поддерживает Unicode. В JavaScript escapes полезны в строках с проблемными символами, в регулярных выражениях и когда исходный код должен быть чисто ASCII из-за системных ограничений.

Как обрабатываются эмодзи и суррогатные пары?

Эмодзи и многие азиатские символы находятся за пределами BMP (U+10000 до U+10FFFF). В формате \uXXXX они представляются суррогатными парами: двумя последовательными значениями \uXXXX. Например, 🎉 = \uD83C\uDF89. Именно так работал JavaScript ES5. Формат \u{1F389} (ES6) позволяет избежать путаницы с суррогатными парами и использовать прямую кодовую точку.

Как Unicode-escapes применяются в i18n?

В задачах интернационализации (i18n) файлы Java .properties исторически требовали записи не-ASCII-символов в формате \uXXXX. Инструмент native2ascii преобразовывал файлы с родными символами в этот формат. С Java 9 файлы .properties поддерживают UTF-8 напрямую. Тем не менее многие устаревшие проекты сохраняют формат с escapes, и данный конвертер упрощает работу с ними.