DokumenteBilderMedienPDF-Werkzeuge

ASCII- und Unicode-Tabelle Online

Interaktive ASCII- und Unicode-Zeichentabelle mit Suche nach Zeichen, Code oder Name.

A

LATIN CAPITAL LETTER A

Processed in your browser

Vollständige interaktive ASCII- und Unicode-Tabelle

Volles ASCII + Unicode

Deckt alle 128 ASCII-Zeichen ab und lässt dich jeden Unicode-Block nach Name oder Codepunkt durchsuchen.

100 % privat

Die Suche findet in deinem Browser statt. Es werden keine Daten an einen Server gesendet.

Mehrere Darstellungen

Dezimal, Hex, Oktal, Binär, HTML-Entity, JS/Python/C-Escape und offizieller Unicode-Name.

Sofort

Echtzeit-Suche. Ohne Registrierung, ohne Wartezeit.

Drei Schritte, kein Aufwand

1

Zeichen oder Code suchen

Tippe ein Zeichen (A, €, ä), einen Dezimalcode (65), Hex (0x41) oder den Unicode-Namen (LATIN CAPITAL LETTER A).

2

Tabelle durchstöbern

Navigiere durch alle 128 ASCII-Zeichen oder erkunde Unicode-Blöcke. Jeder Eintrag zeigt Dezimal, Hex, Oktal, Binär und offiziellen Namen.

3

Code kopieren

Kopiere das Zeichen, den HTML-Code (A), die JavaScript-Escapesequenz (\u0041) oder den Unicode-Codepunkt (U+0041).

Noch Fragen?

ASCII (American Standard Code for Information Interchange) ist ein 7-Bit-Zeichenkodierungsstandard, der 1963 vom ASA (American Standards Association, heute ANSI) veröffentlicht wurde. Er definiert 128 Zeichen: 33 nicht druckbare Steuerzeichen (0-31 und 127) und 95 druckbare Zeichen (Groß- und Kleinbuchstaben, Ziffern, Satzzeichen und einfache Symbole). Hauptverantwortlich dafür war Bob Bemer; ASCII wurde zum universellen Standard für englischsprachige Datenkommunikation.

ASCII ist ein 7-Bit-System mit 128 Zeichen, nur für Englisch. Unicode ist ein internationaler Standard, der jedem Zeichen aller Schriftsysteme der Welt eine eindeutige Nummer (Codepunkt) zuweist; Version 15.1 definiert 149.186 Zeichen. UTF-8 ist eine Kodierung variabler Länge für Unicode: 1 Byte für ASCII (abwärtskompatibel), 2 Bytes für lateinische Zeichen mit Akzent und andere Schriften, 3 Bytes für die meisten CJK-Zeichen (Chinesisch/Japanisch/Koreanisch) und 4 Bytes für Emojis und historische Zeichen.

Unicode 15.1 (veröffentlicht im September 2023) definiert 149.186 Zeichen in 161 Schriften. Der gesamte Unicode-Codepunkt-Raum umfasst 1.114.112 Punkte (von U+0000 bis U+10FFFF), aufgeteilt in 17 Ebenen mit je 65.536 Codepunkten. Die Grundlegende Mehrsprachige Ebene (BMP, U+0000-U+FFFF) enthält die häufigsten Zeichen. Die Ebenen 1-16 sind ergänzende Ebenen mit Emojis (Emoticons-Block, U+1F600-U+1F64F), historischen Zeichen und weniger verwendeten Schriften.

Die ersten 32 ASCII-Zeichen (0-31) sind Steuerzeichen, die von Fernschreiber-Systemen stammen. Die heute wichtigsten: NUL (0) als Zeichenketten-Terminator in C, TAB (9) horizontaler Tabulator, LF (10 / \n) Zeilenvorschub (Unix-Zeilenende), CR (13 / \r) Wagenrücklauf (altes Mac, und \r\n unter Windows), ESC (27) für ANSI-Terminalsequenzen, DEL (127) löschen. Der Unterschied \r\n (Windows) vs. \n (Unix) in Textdateien ist eines der häufigsten Probleme bei der plattformübergreifenden Entwicklung.

Das ursprüngliche ASCII definiert nur Zeichen 0-127 (7 Bits). Erweitertes ASCII nutzt das achte Bit (128-255), ist aber kein einheitlicher Standard: Es existieren mehrere inkompatible Kodierungen. Die häufigsten sind ISO 8859-1 (Latin-1, für Westeuropa), Windows-1252 (ähnlich wie Latin-1, aber mit zusätzlichen Zeichen wie €), CP437 (die originale IBM-PC-Kodierung mit Linienzeichnungszeichen). Diese Inkompatibilität war einer der wichtigsten Gründe für die Entwicklung von Unicode.

Geschichte von ASCII (Bob Bemer 1963), das Unicode-Konsortium und die UTF-8-Kodierung (Rob Pike/Ken Thompson 1992)

ASCII wurde hauptsächlich von Bob Bemer entwickelt, einem IBM-Ingenieur, der ein Pionier der Standardisierung in der Informatik war. Der erste Entwurf des Standards wurde 1963 vom ASA (American Standards Association) vorgelegt. Bemer trug auch zur Aufnahme des Backslash (\) in ASCII bei und warnte schon 1958 als einer der ersten vor dem Jahr-2000-Problem (Y2K). ASCII löste ein kritisches Problem: In den 1960er Jahren gab es Dutzende inkompatibler Zeichencodes (BCD, IBMs EBCDIC, Baudot der Fernschreiber), die eine Kommunikation zwischen Systemen verschiedener Hersteller unmöglich machten.

Unicode wurde 1987 von Joe Becker (Xerox) sowie Lee Collins und Mark Davis (Apple) mit dem Ziel konzipiert, ein universelles Kodierungssystem zu schaffen. Das Unicode-Konsortium wurde im Januar 1991 gegründet und veröffentlichte im Oktober 1991 Version 1.0 mit 7.161 Zeichen. Das Wachstum war exponentiell: Unicode 2.0 (1996) fügte den vollständigen CJK-Zeichensatz mit 20.902 Ideogrammen hinzu. Unicode 6.0 (2010) ergänzte die ersten offiziellen Emojis. Das Konsortium koordiniert mit der ISO (der Standard ISO/IEC 10646 ist in seinem Zeichenrepertoire identisch mit Unicode).

UTF-8 wurde im September 1992 von Ken Thompson und Rob Pike entwickelt – der Legende nach buchstäblich auf einer Serviette beim Abendessen. Der Schlüssel zum Entwurf von UTF-8 ist die Abwärtskompatibilität mit ASCII: Jeder gültige ASCII-Text ist automatisch gültiger UTF-8-Text. Multi-Byte-UTF-8-Bytes enthalten nie Werte im ASCII-Bereich (0-127), wodurch ASCII-Bytes von Bytes in Mehrbytesequenzen unterschieden werden können. Diese Kompatibilität war entscheidend für die Akzeptanz: Systeme, die ASCII voraussetzten, funktionierten weiterhin. UTF-8 ist heute die dominante Kodierung im Web (laut W3Techs über 98 %) und die Standardkodierung in den meisten modernen Programmiersprachen.