ДокументыИзображенияМедиаИнструменты PDF

Таблица ASCII и Unicode Онлайн

Интерактивная таблица символов ASCII и Unicode с поиском по символу, коду или имени.

A

LATIN CAPITAL LETTER A

Processed in your browser

Полная интерактивная таблица ASCII и Unicode

Полный ASCII + Unicode

Охватывает все 128 ASCII-символов и позволяет исследовать любой Unicode-блок по имени или кодовой точке.

100% приватно

Поиск происходит в вашем браузере. Никакие данные не отправляются на серверы.

Множество представлений

Десятичное, шестнадцатеричное, восьмеричное, двоичное, HTML-сущность, JS/Python/C escape и официальное Unicode-имя.

Мгновенно

Поиск в реальном времени. Никакой регистрации и ожидания.

Три шага — никаких сложностей

1

Найдите символ или код

Введите символ (A, €, ñ), десятичный код (65), шестнадцатеричный (0x41) или Unicode-имя (LATIN CAPITAL LETTER A).

2

Просматривайте таблицу

Перемещайтесь по всем 128 ASCII-символам или исследуйте Unicode-блоки. Каждая запись показывает десятичное, шестнадцатеричное, восьмеричное, двоичное представление и официальное имя.

3

Скопируйте код

Скопируйте символ, HTML-код (A), JavaScript escape-последовательность (\u0041) или Unicode кодовую точку (U+0041).

Остались вопросы?

ASCII (American Standard Code for Information Interchange) — 7-битный стандарт кодирования символов, опубликованный в 1963 году ASA (American Standards Association, ныне ANSI). Он определяет 128 символов: 33 непечатаемых управляющих символа (0–31 и 127) и 95 печатаемых (заглавные и строчные буквы, цифры, знаки препинания и основные символы). Разработан главным образом Бобом Бемером и стал универсальным стандартом для обмена данными на английском языке.

ASCII — 7-битная система с 128 символами, только для английского. Unicode — международный стандарт, присваивающий уникальный номер (кодовую точку) каждому символу всех письменных систем мира; версия 15.1 определяет 149 186 символов. UTF-8 — кодировка Unicode переменной длины: 1 байт для ASCII (обратная совместимость), 2 байта для латиницы с диакритиками и других письменностей, 3 байта для большинства CJK-символов и 4 байта для эмодзи и исторических символов.

Unicode 15.1 (опубликован в сентябре 2023 года) определяет 149 186 символов в 161 письменности. Общее пространство кодовых точек Unicode — 1 114 112 (от U+0000 до U+10FFFF), разделённых на 17 плоскостей по 65 536 кодовых точек каждая. Базовая многоязычная плоскость (BMP, U+0000–U+FFFF) содержит наиболее распространённые символы. Плоскости 1–16 — дополнительные плоскости, включающие эмодзи, исторические символы и редко используемые письменности.

Первые 32 ASCII-символа (0–31) — управляющие символы, унаследованные от телетайпных систем. Наиболее актуальные сегодня: NUL (0) — терминатор строки в C, TAB (9) — горизонтальная табуляция, LF (10 / \n) — перевод строки (Unix-перенос), CR (13 / \r) — возврат каретки (старый Mac, \r\n в Windows), ESC (27) — используется в ANSI-терминальных последовательностях, DEL (127) — удаление. Разница между \r\n (Windows) и \n (Unix) в текстовых файлах — одна из наиболее частых проблем при кроссплатформенной разработке.

Оригинальный ASCII определяет только символы 0–127 (7 бит). «Расширенный ASCII» использует восьмой бит (128–255), но это не единый стандарт: существует множество несовместимых кодировок. Наиболее распространённые: ISO 8859-1 (Latin-1, для Западной Европы), Windows-1252 (похожа на Latin-1, но с дополнительными символами вроде €), CP437 (оригинальная кодировка IBM PC, с символами псевдографики). Эта несовместимость стала одним из ключевых мотивов для разработки Unicode.

История ASCII (Боб Бемер, 1963), Консорциум Unicode и кодировка UTF-8 (Роб Пайк/Кен Томпсон, 1992)

ASCII был разработан главным образом Бобом Бемером — инженером IBM, ставшим первопроходцем стандартизации в вычислительной технике. Первый проект стандарта был представлен в 1963 году ASA (American Standards Association). Бемер также внёс вклад в принятие обратного слеша (\) в ASCII и стал первопроходцем в предупреждении о проблеме 2000 года (Y2K) ещё в 1958 году. ASCII решил критическую проблему: в 1960-х годах существовали десятки несовместимых кодировок символов (BCD, EBCDIC от IBM, Baudot от телетайпов), что делало невозможной коммуникацию между системами разных производителей.

Unicode был задуман в 1987 году Джо Бекером (Xerox), Ли Коллинсом и Марком Дэвисом (Apple) для создания универсальной системы кодирования. Консорциум Unicode был основан в январе 1991 года и опубликовал версию 1.0 в октябре 1991 года, охватывавшую 7 161 символ. Рост был экспоненциальным: Unicode 2.0 (1996) добавил полный набор CJK-символов с 20 902 иероглифами. Unicode 6.0 (2010) добавил первые официальные эмодзи. Консорциум координирует работу с ISO (стандарт ISO/IEC 10646 идентичен Unicode по набору символов).

UTF-8 был разработан Кеном Томпсоном и Робом Пайком в сентябре 1992 года — по легенде, буквально на салфетке во время ужина. Ключ к дизайну UTF-8 — обратная совместимость с ASCII: любой допустимый ASCII-текст автоматически является допустимым UTF-8. Многобайтные UTF-8 последовательности никогда не содержат значений из диапазона ASCII (0–127), что позволяет отличать ASCII-байты от байтов многобайтных последовательностей. Эта совместимость была решающей для внедрения: системы, рассчитанные на ASCII, продолжали работать. UTF-8 сейчас является доминирующей кодировкой в интернете (>98% по данным W3Techs) и кодировкой по умолчанию в большинстве современных языков программирования.