DokumentyObrazyMediaNarzędzia PDF

Tabela ASCII i Unicode Online

Interaktywna tabela znaków ASCII i Unicode z wyszukiwaniem po znaku, kodzie lub nazwie.

A

LATIN CAPITAL LETTER A

Processed in your browser

Kompletna interaktywna tabela ASCII i Unicode

Pełne ASCII + Unicode

Obejmuje wszystkie 128 znaków ASCII i pozwala eksplorować dowolny blok Unicode według nazwy lub punktu kodu.

100% prywatne

Wyszukiwanie odbywa się w Twojej przeglądarce. Żadne dane nie są wysyłane na jakikolwiek serwer.

Wiele reprezentacji

Dziesiętna, hex, ósemkowa, binarna, encja HTML, sekwencja escape JS/Python/C i oficjalna nazwa Unicode.

Natychmiast

Wyszukiwanie w czasie rzeczywistym. Bez rejestracji, bez czekania.

Trzy kroki, żadnych komplikacji

1

Wyszukaj znak lub kod

Wpisz znak (A, €, ń), kod dziesiętny (65), szesnastkowy (0x41) lub nazwę Unicode (LATIN CAPITAL LETTER A).

2

Przeglądaj tabelę

Przeglądaj wszystkie 128 znaków ASCII lub eksploruj bloki Unicode. Każdy wpis pokazuje kod dziesiętny, hex, ósemkowy, binarny i oficjalną nazwę.

3

Skopiuj kod

Skopiuj znak, kod HTML (A), sekwencję escape JavaScript (\u0041) lub punkt kodu Unicode (U+0041).

Masz pytania?

ASCII (American Standard Code for Information Interchange) to 7-bitowy standard kodowania znaków opublikowany w 1963 przez ASA (American Standards Association, obecnie ANSI). Definiuje 128 znaków: 33 niedrukowalne znaki sterujące (0–31 i 127) i 95 znaków drukowalnych (wielkie i małe litery, cyfry, interpunkcja i podstawowe symbole). Został zaprojektowany głównie przez Boba Bemera i stał się powszechnym standardem dla anglojęzycznej komunikacji danych.

ASCII to system 7-bitowy z 128 znakami, tylko dla języka angielskiego. Unicode to międzynarodowy standard przypisujący unikalny numer (punkt kodu) każdemu znakowi każdego systemu pisma na świecie; wersja 15.1 definiuje 149 186 znaków. UTF-8 to kodowanie o zmiennej długości dla Unicode: używa 1 bajtu dla ASCII (wstecznie kompatybilne), 2 bajtów dla akcentowanych znaków łacińskich i innych skryptów, 3 bajtów dla większości znaków CJK (chińskich/japońskich/koreańskich) i 4 bajtów dla emoji i znaków historycznych.

Unicode 15.1 (opublikowany we wrześniu 2023) definiuje 149 186 znaków w 161 skryptach. Całkowita przestrzeń punktów kodu Unicode wynosi 1 114 112 (od U+0000 do U+10FFFF), podzielona na 17 płaszczyzn po 65 536 punktów kodu. Podstawowa Płaszczyzna Wielojęzyczna (BMP, U+0000–U+FFFF) zawiera najczęściej używane znaki. Płaszczyzny 1–16 to 'płaszczyzny uzupełniające', zawierające m.in. emoji (blok Emoticons, U+1F600–U+1F64F), znaki historyczne i rzadziej używane skrypty.

Pierwsze 32 znaki ASCII (0–31) to znaki sterujące odziedziczone z systemów dalekopisu. Najistotniejsze dziś: NUL (0) terminator ciągu w C, TAB (9) tabulacja pozioma, LF (10 / \n) znak nowej linii (koniec linii w Unix), CR (13 / \r) powrót karetki (stary Mac i \r\n w Windows), ESC (27) używany w sekwencjach terminala ANSI, DEL (127) usuń. Różnica \r\n (Windows) kontra \n (Unix) w plikach tekstowych to jeden z najczęstszych problemów w tworzeniu aplikacji wieloplatformowych.

Oryginalny ASCII definiuje tylko znaki 0–127 (7 bitów). 'Rozszerzone ASCII' używa ósmego bitu (128–255), ale nie jest jednym standardem: istnieje wiele niekompatybilnych kodowań. Najczęstsze to ISO 8859-1 (Latin-1, dla Europy Zachodniej), Windows-1252 (podobny do Latin-1, ale z dodatkowymi znakami jak €), CP437 (oryginalne kodowanie IBM PC z znakami ramek). Ta niezgodność była jedną z głównych motywacji do opracowania Unicode.

Historia ASCII (Bob Bemer 1963), Unicode Consortium i kodowanie UTF-8 (Rob Pike/Ken Thompson 1992)

ASCII został opracowany głównie przez Boba Bemera, inżyniera IBM będącego pionierem standaryzacji w informatyce. Pierwszy projekt standardu został przedstawiony w 1963 przez ASA (American Standards Association). Bemer przyczynił się też do adopcji ukośnika odwrotnego (\) w ASCII i był pionierem w alarmowaniu o problemie roku 2000 (Y2K) już od 1958. ASCII rozwiązał krytyczny problem: w latach 60. istniały dziesiątki niekompatybilnych kodowań znaków (BCD, EBCDIC firmy IBM, Baudot z dalekopisu), uniemożliwiając komunikację między systemami różnych producentów.

Unicode powstał w 1987 roku za sprawą Joe Beckera (Xerox) oraz Lee Collinsa i Marka Davisa (Apple), aby stworzyć powszechny system kodowania. Unicode Consortium zostało założone w styczniu 1991 i opublikowało wersję 1.0 w październiku 1991, obejmując 7 161 znaków. Wzrost był wykładniczy: Unicode 2.0 (1996) dodał kompletny zestaw znaków CJK z 20 902 ideogramami. Unicode 6.0 (2010) dodał pierwsze oficjalne emoji. Konsorcjum koordynuje działania z ISO (standard ISO/IEC 10646 jest identyczny z Unicode pod względem repertuaru znaków).

UTF-8 został zaprojektowany przez Kena Thompsona i Roba Pike'a we wrześniu 1992, dosłownie na serwetce podczas kolacji, według legendy. Kluczem w projekcie UTF-8 jest wsteczna kompatybilność z ASCII: każdy poprawny tekst ASCII jest automatycznie poprawnym tekstem UTF-8. Wielobajtowe bajty UTF-8 nigdy nie zawierają wartości z zakresu ASCII (0–127), co pozwala odróżnić bajty ASCII od bajtów w sekwencjach wielobajtowych. Ta kompatybilność była kluczowa dla adopcji: systemy zakładające ASCII nadal działały poprawnie. UTF-8 jest teraz dominującym kodowaniem w sieci (>98% według W3Techs) i domyślnym kodowaniem w większości nowoczesnych języków programowania.