Konverter Unicode Escape Online
Konversi teks ke urutan escape Unicode dan sebaliknya di browser Anda.
Kegunaannya
Teks Unicode ke urutan escape
Format JSON dan JS
Menghasilkan escape uXXXX yang kompatibel dengan JSON, Java, C#, dan JavaScript ES5, atau format baru ES6.
100% privat
Enkoding dan dekoding terjadi di browser Anda. Tidak ada data yang meninggalkan perangkat Anda.
Dukungan emoji
Menangani pasangan surrogate UTF-16 dan code point di luar BMP termasuk emoji dan CJK terpadu yang diperluas secara benar.
Instan
Hasil diperbarui secara real-time saat Anda mengetik atau menempel konten.
Cara kerjanya
Tiga langkah, tanpa kerumitan
Masukkan teks atau escape Anda
Tempel teks yang ingin Anda konversi ke escape Unicode, atau tempel urutan escape yang ingin Anda dekode kembali menjadi teks yang dapat dibaca.
Pilih mode konversi
Pilih Teks ke Escape untuk enkoding atau Escape ke Teks untuk dekoding. Anda dapat memilih antara format uXXXX untuk BMP dan format ES6 yang mendukung emoji dan karakter di luar BMP.
Salin hasilnya
Hasilnya muncul secara real-time. Gunakan tombol salin untuk membawanya ke clipboard Anda.
FAQ
Ada pertanyaan?
Urutan escape Unicode adalah representasi tekstual karakter Unicode yang hanya menggunakan karakter ASCII. Format uXXXX merepresentasikan code point Unicode dengan empat digit heksadesimal yang mencakup BMP yaitu 65536 karakter pertama. Contohnya u0041 adalah huruf A, u00E9 adalah e beraksen, dan u4E2D adalah karakter Tionghoa. Digunakan ketika sistem target tidak mendukung karakter non-ASCII secara langsung.
Format uXXXX adalah format klasik yang mencakup BMP dari U+0000 hingga U+FFFF. Berfungsi dalam JSON, Java, C#, JavaScript ES5, dan Python. Format ES6 dengan kurung kurawal adalah format yang diperluas dari ECMAScript 2015 yang mendukung code point Unicode apa pun, termasuk karakter di luar BMP seperti emoji. Gunakan format ini ketika Anda memerlukan kompatibilitas dengan karakter tambahan dalam JavaScript modern.
JSON memerlukan file dalam format ASCII atau UTF-8 tetapi mengizinkan escape uXXXX untuk merepresentasikan karakter apa pun. Ini menjamin interoperabilitas ketika saluran komunikasi tidak menangani Unicode dengan baik. Dalam JavaScript, escape berguna dalam string dengan karakter yang bermasalah, dalam ekspresi reguler, dan ketika kode sumber harus berupa ASCII murni karena persyaratan sistem.
Emoji dan banyak karakter Asia tambahan berada di luar BMP dari U+10000 hingga U+10FFFF. Dalam format uXXXX, keduanya direpresentasikan sebagai pasangan surrogate yaitu dua nilai uXXXX yang berurutan. Format ES6 dengan kurung kurawal menghindari kerumitan pasangan surrogate dan menggunakan code point langsung.
Dalam internasionalisasi, file .properties Java secara historis mengharuskan karakter non-ASCII dalam format uXXXX. Alat native2ascii mengonversi file dengan karakter asli ke format ini. Sejak Java 9, file .properties mendukung UTF-8 secara langsung. Namun banyak proyek lama mempertahankan format escape dan konverter ini memudahkan pengerjaan dengan format tersebut.
Unicode: sejarah 1991, enkoding UTF-8, dan escape dalam bahasa pemrograman
Unicode dibuat untuk menyelesaikan kekacauan enkoding yang tidak kompatibel: ASCII tahun 1963 hanya memiliki 128 karakter, Latin-1, Big5, Shift-JIS, KOI8-R, dan setiap wilayah menggunakan sistemnya sendiri. Unicode Consortium dibentuk pada tahun 1988 dan menerbitkan versi pertama standar pada tahun 1991, dengan tujuan menetapkan nomor unik yang disebut code point untuk setiap karakter dalam semua sistem penulisan dunia. Unicode 15.1 saat ini mendefinisikan lebih dari 149.000 karakter.
UTF-8 yang dirancang oleh Ken Thompson dan Rob Pike pada tahun 1992 menjadi enkoding dominan di Internet berkat kompatibilitasnya dengan ASCII dan efisiensinya untuk teks Barat. Pada tahun 2008 melampaui Latin-1 sebagai enkoding yang paling banyak digunakan di web, dan sejak tahun 2012 merupakan enkoding lebih dari 90% dari semua halaman web. Urutan escape uXXXX memungkinkan karakter Unicode apa pun direpresentasikan dalam string ASCII murni.
Setiap bahasa pemrograman modern memiliki sintaks escape Unicode-nya sendiri: Python menggunakan uXXXX dan UXXXXXXXX, Java dan C# menggunakan uXXXX, JavaScript ES5 menggunakan uXXXX dengan pasangan surrogate untuk BMP yang diperluas, ES6 memperkenalkan format dengan kurung kurawal, dan Rust menggunakan format yang sama. File JSON harus berupa UTF-8 dan mengizinkan uXXXX untuk karakter apa pun, menjadikan konverter ini sangat berguna saat bekerja dengan API atau file konfigurasi yang diinternasionalisasi.