Конвертер Unicode Escape Онлайн
Конвертируйте текст в Unicode-последовательности и обратно прямо в браузере.
Для чего это нужно
Unicode-текст ↔ escape-последовательности
Форматы JSON и JS
Генерирует \uXXXX-escapes, совместимые с JSON, Java, C# и JavaScript ES5, или новый формат \u{} из ES6.
100% приватно
Кодирование и декодирование происходят в вашем браузере. Данные не покидают устройство.
Поддержка эмодзи
Корректно обрабатывает суррогатные пары UTF-16 и кодовые точки за пределами BMP (эмодзи, расширенный CJK).
Мгновенно
Результат обновляется в реальном времени по мере ввода или вставки текста.
Как это работает
Три шага — никаких сложностей
Введите текст или escape-последовательности
Вставьте текст, который нужно закодировать в Unicode-escapes (например, \u0048\u0065\u006C\u006C\u006F), или вставьте escape-последовательности, чтобы декодировать их обратно в читаемый текст.
Выберите направление конвертации
Выберите режим "Текст → Escape" для кодирования или "Escape → Текст" для декодирования. Доступны формат \uXXXX (BMP) и \u{XXXXX} (ES6, поддерживает эмодзи и символы за пределами BMP).
Скопируйте результат
Результат появляется в режиме реального времени. Используйте кнопку копирования, чтобы сохранить его в буфер обмена.
FAQ
Остались вопросы?
Это текстовые представления Unicode-символов с использованием только ASCII-символов. Формат \uXXXX обозначает кодовую точку Unicode четырьмя шестнадцатеричными цифрами (охватывает BMP — первые 65536 символов). Примеры: \u0041 = 'A', \u00E9 = 'é', \u4E2D = '中'. Используются, когда целевая система не поддерживает символы вне ASCII напрямую.
\uXXXX — классический формат, охватывающий BMP (U+0000 до U+FFFF). Работает в JSON, Java, C#, JavaScript ES5 и Python. \u{XXXXX} — расширенный формат ES6 (ECMAScript 2015), поддерживающий любую кодовую точку Unicode, включая символы за пределами BMP, такие как эмодзи (🎉 = \u{1F389}). Используйте его, когда нужна совместимость с дополнительными символами в современном JavaScript.
JSON требует кодировки ASCII или UTF-8, но допускает \uXXXX для представления любого символа. Это гарантирует совместимость, когда канал передачи не поддерживает Unicode. В JavaScript escapes полезны в строках с проблемными символами, в регулярных выражениях и когда исходный код должен быть чисто ASCII из-за системных ограничений.
Эмодзи и многие азиатские символы находятся за пределами BMP (U+10000 до U+10FFFF). В формате \uXXXX они представляются суррогатными парами: двумя последовательными значениями \uXXXX. Например, 🎉 = \uD83C\uDF89. Именно так работал JavaScript ES5. Формат \u{1F389} (ES6) позволяет избежать путаницы с суррогатными парами и использовать прямую кодовую точку.
В задачах интернационализации (i18n) файлы Java .properties исторически требовали записи не-ASCII-символов в формате \uXXXX. Инструмент native2ascii преобразовывал файлы с родными символами в этот формат. С Java 9 файлы .properties поддерживают UTF-8 напрямую. Тем не менее многие устаревшие проекты сохраняют формат с escapes, и данный конвертер упрощает работу с ними.
Unicode: история (1991), кодировка UTF-8 и escape-последовательности в языках программирования
Unicode был создан для решения хаоса несовместимых кодировок: ASCII (1963, всего 128 символов), Latin-1, Big5, Shift-JIS, KOI8-R — каждый регион использовал свою систему. Консорциум Unicode был основан в 1988 году и опубликовал первую версию стандарта в 1991 году с целью присвоения уникального номера (кодовой точки) каждому символу всех письменных систем мира. В Unicode 15.1 определено свыше 149 000 символов.
UTF-8, разработанный Кеном Томпсоном и Робом Пайком в 1992 году, стал доминирующей кодировкой в интернете благодаря совместимости с ASCII и эффективности для западных текстов. В 2008 году он обогнал Latin-1 по распространённости, а с 2012 года используется более чем на 90% всех веб-страниц. Escape-последовательности \uXXXX позволяют представлять любой символ Unicode внутри чисто ASCII-строк.
Каждый современный язык программирования имеет собственный синтаксис Unicode-escapes: Python использует \uXXXX и \UXXXXXXXX, Java и C# — \uXXXX, JavaScript ES5 — \uXXXX с суррогатными парами, ES6 ввёл \u{XXXXX}, Rust использует \u{XXXXX}. JSON-файлы должны быть в UTF-8 и допускают \uXXXX для любого символа, что делает этот конвертер особенно полезным при работе с интернационализированными API или конфигурационными файлами.