DocumentosImagensMídiaFerramentas PDF

Tabela ASCII e Unicode Online

Tabela interativa de caracteres ASCII e Unicode com busca por caractere, código ou nome.

A

LATIN CAPITAL LETTER A

Processed in your browser

Tabela ASCII e Unicode interativa completa

ASCII completo + Unicode

Cobre todos os 128 caracteres ASCII e permite explorar qualquer bloco Unicode por nome ou ponto de código.

100% privado

A busca acontece no seu navegador. Nenhum dado é enviado a nenhum servidor.

Múltiplas representações

Decimal, hex, octal, binário, entidade HTML, escape JS/Python/C e nome Unicode oficial.

Instantâneo

Busca em tempo real. Sem cadastro, sem espera.

Três passos, sem complicação

1

Busque um caractere ou código

Digite um caractere (A, euro, ñ), um código decimal (65), hex (0x41) ou o nome Unicode (LATIN CAPITAL LETTER A).

2

Navegue pela tabela

Percorra todos os 128 caracteres ASCII ou explore blocos Unicode. Cada entrada mostra decimal, hex, octal, binário e nome oficial.

3

Copie o código

Copie o caractere, o código HTML (A), a sequência de escape JavaScript (\u0041) ou o ponto de código Unicode (U+0041).

Ficou com dúvidas?

ASCII (American Standard Code for Information Interchange) é um padrão de codificação de caracteres de 7 bits publicado em 1963 pela ASA (American Standards Association, hoje ANSI). Define 128 caracteres: 33 caracteres de controle não imprimíveis (0-31 e 127) e 95 caracteres imprimíveis (letras maiúsculas e minúsculas, dígitos, pontuação e símbolos básicos). Foi projetado principalmente por Bob Bemer e se tornou o padrão universal para comunicação de dados em inglês.

O ASCII é um sistema de 7 bits com 128 caracteres, apenas para o inglês. O Unicode é um padrão internacional que atribui um número único (ponto de código) a cada caractere de todos os sistemas de escrita do mundo; a versão 15.1 define 149.186 caracteres. O UTF-8 é uma codificação de comprimento variável para Unicode: usa 1 byte para ASCII (compatível com versões anteriores), 2 bytes para caracteres latinos acentuados e outros scripts, 3 bytes para a maioria dos caracteres CJK (chinês/japonês/coreano) e 4 bytes para emojis e caracteres históricos.

O Unicode 15.1 (publicado em setembro de 2023) define 149.186 caracteres em 161 scripts. O espaço total de pontos de código Unicode é 1.114.112 (de U+0000 a U+10FFFF), dividido em 17 planos de 65.536 pontos de código cada. O Plano Multilíngue Básico (BMP, U+0000-U+FFFF) contém os caracteres mais comuns. Os planos 1-16 são planos suplementares que incluem emojis (bloco Emoticons, U+1F600-U+1F64F), caracteres históricos e scripts menos usados.

Os primeiros 32 caracteres ASCII (0-31) são caracteres de controle herdados de sistemas de teleimpressora. Os mais relevantes hoje: NUL (0) terminador de string em C, TAB (9) tabulação horizontal, LF (10 ou \n) nova linha (Unix), CR (13 ou \r) retorno de carro (Mac antigo e \r\n no Windows), ESC (27) usado em sequências de terminal ANSI, DEL (127) apagar. A diferença \r\n (Windows) vs \n (Unix) em arquivos de texto é um dos problemas mais frequentes no desenvolvimento multiplataforma.

O ASCII original define apenas os caracteres 0-127 (7 bits). O ASCII estendido usa o oitavo bit (128-255), mas não é um padrão único: existem várias codificações incompatíveis. As mais comuns são ISO 8859-1 (Latin-1, para a Europa Ocidental), Windows-1252 (semelhante ao Latin-1, mas com caracteres extras como o euro) e CP437 (a codificação original do IBM PC, com caracteres de desenho de caixas). Essa incompatibilidade foi uma das principais motivações para o desenvolvimento do Unicode.

História do ASCII (Bob Bemer 1963), o Consórcio Unicode e a codificação UTF-8 (Rob Pike/Ken Thompson 1992)

O ASCII foi desenvolvido principalmente por Bob Bemer, engenheiro da IBM e pioneiro da padronização na computação. O primeiro rascunho do padrão foi apresentado em 1963 pela ASA (American Standards Association). Bemer também contribuiu para a adoção da barra invertida (\) no ASCII e foi pioneiro em alertar sobre o problema do Ano 2000 (Y2K) já em 1958. O ASCII resolveu um problema crítico: nos anos 1960 havia dezenas de códigos de caracteres incompatíveis (BCD, EBCDIC da IBM, Baudot das teleimpressoras), tornando impossível a comunicação entre sistemas de fabricantes diferentes.

O Unicode foi concebido em 1987 por Joe Becker (Xerox) e Lee Collins e Mark Davis (Apple) para criar um sistema de codificação universal. O Consórcio Unicode foi fundado em janeiro de 1991 e publicou a versão 1.0 em outubro de 1991, cobrindo 7.161 caracteres. O crescimento foi exponencial: o Unicode 2.0 (1996) adicionou o conjunto completo de caracteres CJK com 20.902 ideogramas. O Unicode 6.0 (2010) adicionou os primeiros emojis oficiais. O Consórcio coordena com a ISO (o padrão ISO/IEC 10646 é idêntico ao Unicode em seu repertório de caracteres).

O UTF-8 foi projetado por Ken Thompson e Rob Pike em setembro de 1992, literalmente num guardanapo durante um jantar, segundo a lenda. A chave do design do UTF-8 é sua compatibilidade retroativa com o ASCII: qualquer texto ASCII válido é automaticamente texto UTF-8 válido. Os bytes UTF-8 multibyte nunca contêm valores na faixa ASCII (0-127), o que permite distinguir bytes ASCII de bytes em sequências multibyte. Essa compatibilidade foi crucial para a adoção: os sistemas que assumiam ASCII continuaram funcionando. O UTF-8 é hoje a codificação dominante na web (mais de 98% segundo o W3Techs) e a codificação padrão na maioria das linguagens de programação modernas.