DocumentosImágenesMediaHerramientas PDF

Tabla ASCII/Unicode

Tabla interactiva de caracteres ASCII y Unicode con búsqueda por carácter, código o nombre.

A

LATIN CAPITAL LETTER A

Procesado en tu navegador

Tabla ASCII y Unicode interactiva completa

ASCII completo + Unicode

Cubre los 128 caracteres ASCII y permite explorar cualquier bloque Unicode por nombre o código.

100% privado

La búsqueda ocurre en tu navegador. No se envía ningún dato al servidor.

Múltiples representaciones

Decimal, hex, octal, binario, HTML entity, escape JS/Python/C y nombre Unicode oficial.

Instantáneo

Búsqueda en tiempo real. Sin registro, sin esperas.

Tres pasos, sin complicaciones

1

Busca el carácter o código

Escribe un carácter (A, €, ñ), un código decimal (65), hexadecimal (0x41) o el nombre Unicode (LATIN CAPITAL LETTER A).

2

Consulta la tabla

Navega por los 128 caracteres ASCII o explora bloques Unicode. Cada entrada muestra decimal, hex, octal, binario y nombre oficial.

3

Copia el código

Copia el carácter, el código HTML (A), la secuencia de escape JavaScript (\u0041) o el punto de código Unicode (U+0041).

¿Tienes dudas?

ASCII (American Standard Code for Information Interchange) es un estándar de codificación de caracteres de 7 bits publicado en 1963 por el ASA (American Standards Association, ahora ANSI). Define 128 caracteres: 33 caracteres de control no imprimibles (0-31 y 127) y 95 caracteres imprimibles (letras mayúsculas y minúsculas, dígitos, puntuación y símbolos básicos). Fue diseñado principalmente por Bob Bemer y se convirtió en el estándar universal para la comunicación de datos en inglés.

ASCII es un sistema de 7 bits con 128 caracteres, solo para inglés. Unicode es un estándar internacional que asigna un número único (punto de código) a cada carácter de todos los sistemas de escritura del mundo; la versión 15.1 define 149.186 caracteres. UTF-8 es una codificación de longitud variable para Unicode: usa 1 byte para ASCII (compatible con ASCII), 2 bytes para caracteres latinos con acento y otros scripts, 3 bytes para la mayoría de los caracteres CJK (chino/japonés/coreano), y 4 bytes para emojis y caracteres históricos.

Unicode 15.1 (publicado en septiembre de 2023) define 149.186 caracteres en 161 scripts. El espacio total de puntos de código Unicode es de 1.114.112 (de U+0000 a U+10FFFF), dividido en 17 planos de 65.536 puntos de código cada uno. El Plano Multilingual Básico (BMP, U+0000-U+FFFF) contiene los caracteres más comunes. Los planos 1-16 son 'planos suplementarios' que incluyen emojis (bloque Emoticons, U+1F600-U+1F64F), caracteres históricos, y scripts menos usados.

Los primeros 32 caracteres ASCII (0-31) son caracteres de control heredados de los sistemas de teletipos. Los más relevantes hoy: NUL (0) terminator de cadenas en C, TAB (9) tabulación horizontal, LF (10 / \n) salto de línea (Unix), CR (13 / \r) retorno de carro (Mac antiguo, y \r\n en Windows), ESC (27) usado en secuencias ANSI de terminal, DEL (127) borrar. La diferencia \r\n (Windows) vs \n (Unix) en archivos de texto es uno de los problemas más frecuentes en desarrollo multiplataforma.

ASCII original solo define caracteres 0-127 (7 bits). El 'ASCII extendido' usa el octavo bit (128-255) pero no es un estándar único: existen múltiples codificaciones incompatibles. Las más comunes son ISO 8859-1 (Latin-1, para Europa Occidental), Windows-1252 (similar a Latin-1 pero con caracteres adicionales como €), CP437 (la codificación original de IBM PC, con caracteres de dibujo de caja). Esta incompatibilidad fue uno de los motivadores del desarrollo de Unicode.

Historia de ASCII (Bob Bemer 1963), el Consorcio Unicode, y la codificación UTF-8 (Rob Pike/Ken Thompson 1992)

ASCII fue desarrollado principalmente por Bob Bemer, ingeniero de IBM que fue un pionero de la estandarización en computación. El primer borrador del estándar fue presentado en 1963 por el ASA (American Standards Association). Bemer también contribuyó a la adopción de la barra invertida (\) en ASCII y fue pionero en alertar sobre el problema del año 2000 (Y2K) ya en 1958. ASCII resolvió un problema crítico: en los años 60 existían docenas de códigos de caracteres incompatibles (BCD, EBCDIC de IBM, Baudot de los teletipos), haciendo imposible la comunicación entre sistemas de diferentes fabricantes.

Unicode fue concebido en 1987 por Joe Becker (Xerox) y Lee Collins y Mark Davis (Apple) para crear un sistema de codificación universal. El Consorcio Unicode fue fundado en enero de 1991 y publicó la versión 1.0 en octubre de 1991, cubriendo 7.161 caracteres. El crecimiento ha sido exponencial: Unicode 2.0 (1996) añadió el conjunto completo de caracteres CJK con 20.902 ideogramas. Unicode 6.0 (2010) añadió los primeros emojis oficiales. El Consorcio coordina con ISO (el estándar ISO/IEC 10646 es idéntico a Unicode en su repertorio de caracteres).

UTF-8 fue diseñado por Ken Thompson y Rob Pike en septiembre de 1992, literalmente en una servilleta de papel durante una cena, según la leyenda. La clave del diseño de UTF-8 es su compatibilidad hacia atrás con ASCII: cualquier texto ASCII válido es automáticamente texto UTF-8 válido. Los bytes UTF-8 de múltiples bytes nunca contienen valores del rango ASCII (0-127), lo que permite distinguir bytes ASCII de bytes de secuencias multibyte. Esta compatibilidad fue crucial para la adopción: los sistemas que asumían ASCII seguían funcionando. UTF-8 es hoy la codificación dominante en la web (>98% según W3Techs) y la codificación predeterminada en la mayoría de los lenguajes de programación modernos.