Tabel ASCII dan Unicode Online
Tabel karakter ASCII dan Unicode interaktif dengan pencarian berdasarkan karakter, kode, atau nama.
LATIN CAPITAL LETTER A
Untuk apa alat ini
Tabel ASCII dan Unicode interaktif lengkap
ASCII + Unicode penuh
Mencakup semua 128 karakter ASCII dan memungkinkan Anda menjelajahi blok Unicode apa pun berdasarkan nama atau code point.
100% privat
Pencarian terjadi di browser Anda. Tidak ada data yang dikirim ke server mana pun.
Berbagai representasi
Desimal, hex, oktal, biner, entitas HTML, escape JS/Python/C, dan nama Unicode resmi.
Instan
Pencarian real-time. Tanpa daftar, tanpa menunggu.
Cara kerjanya
Tiga langkah, tanpa kerumitan
Cari karakter atau kode
Ketik karakter (A, euro, n dengan tilde), kode desimal (65), hex (0x41), atau nama Unicode (LATIN CAPITAL LETTER A).
Jelajahi tabel
Navigasikan seluruh 128 karakter ASCII atau jelajahi blok Unicode. Setiap entri menampilkan desimal, hex, oktal, biner, dan nama resmi.
Salin kode
Salin karakter, kode HTML (seperti entitas numerik), urutan escape JavaScript (seperti \u0041), atau code point Unicode (U+0041).
FAQ
Ada pertanyaan?
ASCII (American Standard Code for Information Interchange) adalah standar pengkodean karakter 7-bit yang diterbitkan pada 1963 oleh ASA (American Standards Association, sekarang ANSI). Ia mendefinisikan 128 karakter: 33 karakter kontrol non-cetak (0-31 dan 127) dan 95 karakter yang dapat dicetak (huruf besar dan kecil, digit, tanda baca, dan simbol dasar). Dirancang terutama oleh Bob Bemer dan menjadi standar universal untuk komunikasi data berbahasa Inggris.
ASCII adalah sistem 7-bit dengan 128 karakter, hanya untuk bahasa Inggris. Unicode adalah standar internasional yang menetapkan nomor unik (code point) ke setiap karakter dari setiap sistem tulisan di dunia; versi 15.1 mendefinisikan 149.186 karakter. UTF-8 adalah pengkodean panjang variabel untuk Unicode: menggunakan 1 byte untuk ASCII (kompatibel ke belakang), 2 byte untuk karakter Latin dengan aksen dan skrip lainnya, 3 byte untuk sebagian besar karakter CJK (Cina/Jepang/Korea), dan 4 byte untuk emoji dan karakter historis.
Unicode 15.1 (diterbitkan September 2023) mendefinisikan 149.186 karakter dalam 161 skrip. Total ruang code point Unicode adalah 1.114.112 (dari U+0000 hingga U+10FFFF), dibagi menjadi 17 bidang masing-masing 65.536 code point. Basic Multilingual Plane (BMP, U+0000-U+FFFF) berisi karakter yang paling umum. Bidang 1-16 adalah bidang tambahan yang mencakup emoji, karakter historis, dan skrip yang jarang digunakan.
32 karakter ASCII pertama (0-31) adalah karakter kontrol yang diwarisi dari sistem teletype. Yang paling relevan saat ini: NUL (0) terminator string di C, TAB (9) tab horizontal, LF (10 / \n) line feed (newline Unix), CR (13 / \r) carriage return (Mac lama, dan \r\n di Windows), ESC (27) digunakan dalam urutan terminal ANSI, DEL (127) hapus. Perbedaan \r\n (Windows) vs \n (Unix) dalam file teks adalah salah satu masalah paling sering dalam pengembangan lintas platform.
ASCII asli hanya mendefinisikan karakter 0-127 (7 bit). ASCII yang diperluas menggunakan bit kedelapan (128-255) tetapi bukan standar tunggal: beberapa pengkodean yang tidak kompatibel ada. Yang paling umum adalah ISO 8859-1 (Latin-1, untuk Eropa Barat), Windows-1252 (mirip Latin-1 tetapi dengan karakter tambahan seperti euro), CP437 (pengkodean IBM PC asli, dengan karakter menggambar kotak). Ketidakcocokan ini adalah salah satu motivasi utama pengembangan Unicode.
Sejarah ASCII (Bob Bemer 1963), Unicode Consortium, dan pengkodean UTF-8 (Rob Pike/Ken Thompson 1992)
ASCII dikembangkan terutama oleh Bob Bemer, seorang insinyur IBM yang merupakan pelopor standardisasi dalam komputasi. Draf pertama standar tersebut dipresentasikan pada 1963 oleh ASA (American Standards Association). Bemer juga berkontribusi pada adopsi backslash (\) dalam ASCII dan merupakan pelopor dalam memperingatkan tentang masalah Tahun 2000 (Y2K) sejak 1958. ASCII memecahkan masalah kritis: pada 1960-an ada lusinan kode karakter yang tidak kompatibel (BCD, EBCDIC IBM, Baudot dari teletype), membuat komunikasi antara sistem dari produsen berbeda tidak mungkin.
Unicode dikonseptualisasikan pada 1987 oleh Joe Becker (Xerox) dan Lee Collins serta Mark Davis (Apple) untuk menciptakan sistem pengkodean universal. Unicode Consortium didirikan pada Januari 1991 dan menerbitkan versi 1.0 pada Oktober 1991, mencakup 7.161 karakter. Pertumbuhannya eksponensial: Unicode 2.0 (1996) menambahkan set karakter CJK lengkap dengan 20.902 ideografi. Unicode 6.0 (2010) menambahkan emoji resmi pertama. Konsorsium berkoordinasi dengan ISO (standar ISO/IEC 10646 identik dengan Unicode dalam repertoar karakternya).
UTF-8 dirancang oleh Ken Thompson dan Rob Pike pada September 1992, secara harfiah di selembar serbet saat makan malam, menurut legenda. Kunci desain UTF-8 adalah kompatibilitasnya ke belakang dengan ASCII: teks ASCII yang valid secara otomatis merupakan teks UTF-8 yang valid. Byte UTF-8 multi-byte tidak pernah berisi nilai dalam rentang ASCII (0-127), yang memungkinkan byte ASCII dibedakan dari byte dalam urutan multi-byte. Kompatibilitas ini sangat penting untuk adopsi: sistem yang mengasumsikan ASCII tetap berfungsi. UTF-8 kini menjadi pengkodean dominan di web (lebih dari 98% menurut W3Techs) dan pengkodean default di sebagian besar bahasa pemrograman modern.