DocumentiImmaginiMediaStrumenti PDF

Convertitore Unicode Escape Online

Converti testo in sequenze di escape Unicode e viceversa nel tuo browser.

Elaborato nel tuo browser — nessun testo inviato ad alcun server

Testo Unicode e sequenze di escape

Formati JSON e JS

Genera escape compatibili con JSON, Java, C# e JavaScript ES5, oppure il nuovo formato ES6 con parentesi graffe.

100% privato

La codifica e la decodifica avvengono nel tuo browser. Nessun dato lascia il tuo dispositivo.

Supporto emoji

Gestisce correttamente le coppie surrogate UTF-16 e i code point fuori dal BMP come emoji e CJK unificato esteso.

Immediato

I risultati si aggiornano in tempo reale mentre scrivi o incolli il contenuto.

Tre passaggi, senza complicazioni

1

Inserisci il tuo testo o le sequenze di escape

Incolla il testo che vuoi convertire in escape Unicode, oppure incolla le sequenze di escape che vuoi decodificare in testo leggibile.

2

Seleziona la modalita di conversione

Scegli da Testo a Escape per codificare oppure da Escape a Testo per decodificare. Puoi scegliere tra il formato con quattro cifre hex per il BMP e il formato ES6 con parentesi graffe che supporta anche emoji e caratteri fuori dal BMP.

3

Copia il risultato

Il risultato appare in tempo reale. Usa il pulsante di copia per portarlo negli appunti.

Hai delle domande?

Sono rappresentazioni testuali di caratteri Unicode che usano solo caratteri ASCII. Il formato con quattro cifre hex rappresenta un code point Unicode con quattro cifre esadecimali e copre il BMP, i primi 65.536 caratteri. Ad esempio il valore per A vale 0041, il valore per e con accento acuto vale 00E9 e il valore per il carattere cinese medio vale 4E2D. Vengono usate quando il sistema di destinazione non supporta direttamente i caratteri non ASCII.

Il formato classico copre il BMP da U+0000 a U+FFFF. Funziona in JSON, Java, C#, JavaScript ES5 e Python. Il formato ES6 introdotto con ECMAScript 2015 usa le parentesi graffe e supporta qualsiasi code point Unicode, inclusi i caratteri fuori dal BMP come le emoji. Usalo quando hai bisogno di compatibilita con caratteri supplementari nel JavaScript moderno.

JSON richiede che i file siano ASCII o UTF-8 ma ammette sequenze di escape hex a quattro cifre per rappresentare qualsiasi carattere. Questo garantisce l'interoperabilita quando il canale di comunicazione non gestisce bene Unicode. In JavaScript le escape sono utili nelle stringhe con caratteri problematici, nelle espressioni regolari e quando il codice sorgente deve essere ASCII puro per requisiti di sistema.

Le emoji e molti caratteri asiatici aggiuntivi si trovano fuori dal BMP, tra U+10000 e U+10FFFF. Nel formato a quattro cifre hex vengono rappresentati come coppie surrogate, due valori consecutivi. Ad esempio la coriandoli e una coppia di due valori ES5. Con il formato ES6 si usa il code point diretto evitando la confusione delle coppie surrogate.

Nell'internazionalizzazione, i file .properties di Java richiedevano storicamente che i caratteri non ASCII fossero nel formato a quattro cifre hex. Lo strumento native2ascii convertiva i file con caratteri nativi in questo formato. Da Java 9 i file .properties supportano direttamente UTF-8. Tuttavia molti progetti legacy mantengono il formato con escape e questo convertitore semplifica il lavoro con essi.

Unicode: storia del 1991, codifica UTF-8 e escape nei linguaggi di programmazione

Unicode e stato creato per risolvere il caos delle codifiche incompatibili: ASCII del 1963 con soli 128 caratteri, Latin-1, Big5, Shift-JIS, KOI8-R e molte altre, ognuna con il proprio sistema regionale. Il Consorzio Unicode si e formato nel 1988 e ha pubblicato la prima versione dello standard nel 1991 con l'obiettivo di assegnare un numero univoco, il code point, a ogni carattere di tutti i sistemi di scrittura del mondo. Unicode 15.1 definisce attualmente oltre 149.000 caratteri.

UTF-8, progettato da Ken Thompson e Rob Pike nel 1992, e diventato la codifica dominante su Internet grazie alla sua compatibilita con ASCII e alla sua efficienza per il testo occidentale. Nel 2008 ha superato Latin-1 come codifica piu usata sul web e dal 2012 e la codifica di oltre il 90% di tutte le pagine web. Le sequenze di escape con quattro cifre hex permettono di rappresentare qualsiasi carattere Unicode all'interno di stringhe ASCII pure.

Ogni moderno linguaggio di programmazione ha la propria sintassi per le escape Unicode: Python usa il formato a quattro cifre e il formato a otto cifre, Java e C# usano il formato a quattro cifre, JavaScript ES5 usava il formato a quattro cifre con coppie surrogate per il BMP esteso, ES6 ha introdotto il formato con parentesi graffe, e Rust usa anch'esso il formato con parentesi graffe. I file JSON devono essere UTF-8 e ammettono il formato a quattro cifre per qualsiasi carattere, rendendo questo convertitore particolarmente utile quando si lavora con API internazionalizzate o file di configurazione.