DocumentsImagesMédiasOutils PDF

Table ASCII et Unicode en Ligne

Table interactive de caracteres ASCII et Unicode avec recherche par caractere, code ou nom.

A

LATIN CAPITAL LETTER A

Processed in your browser

Table ASCII et Unicode interactive complete

ASCII complet + Unicode

Couvre les 128 caracteres ASCII et te permet d'explorer n'importe quel bloc Unicode par nom ou point de code.

100% prive

La recherche se fait dans ton navigateur. Aucune donnee n'est envoyee a un serveur.

Representations multiples

Decimal, hex, octal, binaire, entite HTML, echappement JS/Python/C et nom Unicode officiel.

Instantane

Recherche en temps reel. Sans inscription, sans attente.

Trois étapes, sans complications

1

Recherche un caractere ou un code

Tape un caractere (A, euro, n), un code decimal (65), hexadecimal (0x41) ou le nom Unicode (LATIN CAPITAL LETTER A).

2

Parcours la table

Navigue dans les 128 caracteres ASCII ou explore les blocs Unicode. Chaque entree affiche le decimal, l'hex, l'octal, le binaire et le nom officiel.

3

Copie le code

Copie le caractere, le code HTML (A), la sequence d'echappement JavaScript (\u0041) ou le point de code Unicode (U+0041).

Des questions ?

ASCII (American Standard Code for Information Interchange) est un standard d'encodage de caracteres sur 7 bits publie en 1963 par l'ASA (American Standards Association, aujourd'hui ANSI). Il definit 128 caracteres : 33 caracteres de controle non imprimables (0-31 et 127) et 95 caracteres imprimables (lettres majuscules et minuscules, chiffres, ponctuation et symboles de base). Il a ete concu principalement par Bob Bemer et est devenu le standard universel pour la communication de donnees en anglais.

ASCII est un systeme sur 7 bits avec 128 caracteres, uniquement pour l'anglais. Unicode est un standard international qui assigne un numero unique (point de code) a chaque caractere de tous les systemes d'ecriture du monde ; la version 15.1 definit 149 186 caracteres. UTF-8 est un encodage a longueur variable pour Unicode : il utilise 1 octet pour l'ASCII (compatible en amont), 2 octets pour les caracteres latins accentues et d'autres scripts, 3 octets pour la plupart des caracteres CJK (chinois/japonais/coreen) et 4 octets pour les emojis et les caracteres historiques.

Unicode 15.1 (publie en septembre 2023) definit 149 186 caracteres dans 161 scripts. L'espace total des points de code Unicode est de 1 114 112 (de U+0000 a U+10FFFF), divise en 17 plans de 65 536 points de code chacun. Le Plan Multilingue de Base (BMP, U+0000-U+FFFF) contient les caracteres les plus courants. Les plans 1-16 sont des plans supplementaires qui incluent les emojis (bloc Emoticons, U+1F600-U+1F64F), les caracteres historiques et les scripts moins utilises.

Les 32 premiers caracteres ASCII (0-31) sont des caracteres de controle herites des systemes de teleimprimeurs. Les plus pertinents aujourd'hui : NUL (0) terminateur de chaine en C, TAB (9) tabulation horizontale, LF (10 / \n) saut de ligne (Unix), CR (13 / \r) retour chariot (Mac ancien et \r\n sous Windows), ESC (27) utilise dans les sequences de terminal ANSI, DEL (127) suppression. La difference \r\n (Windows) vs \n (Unix) dans les fichiers texte est l'un des problemes les plus frequents en developpement multiplateforme.

L'ASCII original ne definit que les caracteres 0-127 (7 bits). L'ASCII etendu utilise le huitieme bit (128-255) mais n'est pas un standard unique : il existe plusieurs encodages incompatibles. Les plus courants sont ISO 8859-1 (Latin-1, pour l'Europe occidentale), Windows-1252 (similaire a Latin-1 mais avec des caracteres supplementaires comme l'euro) et CP437 (l'encodage IBM PC original, avec des caracteres de dessin de boites). Cette incompatibilite a ete l'une des principales motivations du developpement d'Unicode.

Histoire d'ASCII (Bob Bemer 1963), le Consortium Unicode et l'encodage UTF-8 (Rob Pike/Ken Thompson 1992)

ASCII a ete developpe principalement par Bob Bemer, ingenieur chez IBM et pionnier de la standardisation en informatique. Le premier brouillon du standard a ete presente en 1963 par l'ASA (American Standards Association). Bemer a egalement contribue a l'adoption de la barre oblique inverse (\) dans ASCII et a ete un pionnier dans l'alerte sur le probleme de l'an 2000 (Y2K) des 1958. ASCII a resolu un probleme critique : dans les annees 1960, il existait des dizaines de codes de caracteres incompatibles (BCD, EBCDIC d'IBM, Baudot des teleimprimeurs), rendant impossible la communication entre systemes de fabricants differents.

Unicode a ete concu en 1987 par Joe Becker (Xerox) et Lee Collins et Mark Davis (Apple) pour creer un systeme d'encodage universel. Le Consortium Unicode a ete fonde en janvier 1991 et a publie la version 1.0 en octobre 1991, couvrant 7 161 caracteres. La croissance a ete exponentielle : Unicode 2.0 (1996) a ajoute l'ensemble complet des caracteres CJK avec 20 902 ideogrammes. Unicode 6.0 (2010) a ajoute les premiers emojis officiels. Le Consortium coordonne avec l'ISO (le standard ISO/IEC 10646 est identique a Unicode dans son repertoire de caracteres).

UTF-8 a ete concu par Ken Thompson et Rob Pike en septembre 1992, litteralement sur une serviette de papier lors d'un diner, selon la legende. La cle du design d'UTF-8 est sa compatibilite retrograde avec ASCII : tout texte ASCII valide est automatiquement du texte UTF-8 valide. Les octets UTF-8 multi-octets ne contiennent jamais de valeurs dans la plage ASCII (0-127), ce qui permet de distinguer les octets ASCII des octets des sequences multi-octets. Cette compatibilite a ete cruciale pour son adoption : les systemes qui supposaient l'ASCII continuaient de fonctionner. UTF-8 est aujourd'hui l'encodage dominant sur le web (plus de 98% selon W3Techs) et l'encodage par defaut dans la plupart des langages de programmation modernes.