Tabela ASCII e Unicode Online
Tabela interativa de caracteres ASCII e Unicode com busca por caractere, código ou nome.
LATIN CAPITAL LETTER A
Para que serve
Tabela ASCII e Unicode interativa completa
ASCII completo + Unicode
Cobre todos os 128 caracteres ASCII e permite explorar qualquer bloco Unicode por nome ou ponto de código.
100% privado
A busca acontece no seu navegador. Nenhum dado é enviado a nenhum servidor.
Múltiplas representações
Decimal, hex, octal, binário, entidade HTML, escape JS/Python/C e nome Unicode oficial.
Instantâneo
Busca em tempo real. Sem cadastro, sem espera.
Como funciona
Três passos, sem complicação
Busque um caractere ou código
Digite um caractere (A, euro, ñ), um código decimal (65), hex (0x41) ou o nome Unicode (LATIN CAPITAL LETTER A).
Navegue pela tabela
Percorra todos os 128 caracteres ASCII ou explore blocos Unicode. Cada entrada mostra decimal, hex, octal, binário e nome oficial.
Copie o código
Copie o caractere, o código HTML (A), a sequência de escape JavaScript (\u0041) ou o ponto de código Unicode (U+0041).
Perguntas frequentes
Ficou com dúvidas?
ASCII (American Standard Code for Information Interchange) é um padrão de codificação de caracteres de 7 bits publicado em 1963 pela ASA (American Standards Association, hoje ANSI). Define 128 caracteres: 33 caracteres de controle não imprimíveis (0-31 e 127) e 95 caracteres imprimíveis (letras maiúsculas e minúsculas, dígitos, pontuação e símbolos básicos). Foi projetado principalmente por Bob Bemer e se tornou o padrão universal para comunicação de dados em inglês.
O ASCII é um sistema de 7 bits com 128 caracteres, apenas para o inglês. O Unicode é um padrão internacional que atribui um número único (ponto de código) a cada caractere de todos os sistemas de escrita do mundo; a versão 15.1 define 149.186 caracteres. O UTF-8 é uma codificação de comprimento variável para Unicode: usa 1 byte para ASCII (compatível com versões anteriores), 2 bytes para caracteres latinos acentuados e outros scripts, 3 bytes para a maioria dos caracteres CJK (chinês/japonês/coreano) e 4 bytes para emojis e caracteres históricos.
O Unicode 15.1 (publicado em setembro de 2023) define 149.186 caracteres em 161 scripts. O espaço total de pontos de código Unicode é 1.114.112 (de U+0000 a U+10FFFF), dividido em 17 planos de 65.536 pontos de código cada. O Plano Multilíngue Básico (BMP, U+0000-U+FFFF) contém os caracteres mais comuns. Os planos 1-16 são planos suplementares que incluem emojis (bloco Emoticons, U+1F600-U+1F64F), caracteres históricos e scripts menos usados.
Os primeiros 32 caracteres ASCII (0-31) são caracteres de controle herdados de sistemas de teleimpressora. Os mais relevantes hoje: NUL (0) terminador de string em C, TAB (9) tabulação horizontal, LF (10 ou \n) nova linha (Unix), CR (13 ou \r) retorno de carro (Mac antigo e \r\n no Windows), ESC (27) usado em sequências de terminal ANSI, DEL (127) apagar. A diferença \r\n (Windows) vs \n (Unix) em arquivos de texto é um dos problemas mais frequentes no desenvolvimento multiplataforma.
O ASCII original define apenas os caracteres 0-127 (7 bits). O ASCII estendido usa o oitavo bit (128-255), mas não é um padrão único: existem várias codificações incompatíveis. As mais comuns são ISO 8859-1 (Latin-1, para a Europa Ocidental), Windows-1252 (semelhante ao Latin-1, mas com caracteres extras como o euro) e CP437 (a codificação original do IBM PC, com caracteres de desenho de caixas). Essa incompatibilidade foi uma das principais motivações para o desenvolvimento do Unicode.
História do ASCII (Bob Bemer 1963), o Consórcio Unicode e a codificação UTF-8 (Rob Pike/Ken Thompson 1992)
O ASCII foi desenvolvido principalmente por Bob Bemer, engenheiro da IBM e pioneiro da padronização na computação. O primeiro rascunho do padrão foi apresentado em 1963 pela ASA (American Standards Association). Bemer também contribuiu para a adoção da barra invertida (\) no ASCII e foi pioneiro em alertar sobre o problema do Ano 2000 (Y2K) já em 1958. O ASCII resolveu um problema crítico: nos anos 1960 havia dezenas de códigos de caracteres incompatíveis (BCD, EBCDIC da IBM, Baudot das teleimpressoras), tornando impossível a comunicação entre sistemas de fabricantes diferentes.
O Unicode foi concebido em 1987 por Joe Becker (Xerox) e Lee Collins e Mark Davis (Apple) para criar um sistema de codificação universal. O Consórcio Unicode foi fundado em janeiro de 1991 e publicou a versão 1.0 em outubro de 1991, cobrindo 7.161 caracteres. O crescimento foi exponencial: o Unicode 2.0 (1996) adicionou o conjunto completo de caracteres CJK com 20.902 ideogramas. O Unicode 6.0 (2010) adicionou os primeiros emojis oficiais. O Consórcio coordena com a ISO (o padrão ISO/IEC 10646 é idêntico ao Unicode em seu repertório de caracteres).
O UTF-8 foi projetado por Ken Thompson e Rob Pike em setembro de 1992, literalmente num guardanapo durante um jantar, segundo a lenda. A chave do design do UTF-8 é sua compatibilidade retroativa com o ASCII: qualquer texto ASCII válido é automaticamente texto UTF-8 válido. Os bytes UTF-8 multibyte nunca contêm valores na faixa ASCII (0-127), o que permite distinguir bytes ASCII de bytes em sequências multibyte. Essa compatibilidade foi crucial para a adoção: os sistemas que assumiam ASCII continuaram funcionando. O UTF-8 é hoje a codificação dominante na web (mais de 98% segundo o W3Techs) e a codificação padrão na maioria das linguagens de programação modernas.