DocumentiImmaginiMediaStrumenti PDF

Converti XML in CSV Online

Estrai dati da XML in CSV nel tuo browser, senza installare nulla.

Trascina il tuo PDF qui

.pdf · fino a 2 GB

GratisSenza registrazioneSenza filigranaOCR incluso

Da XML a CSV per l'analisi dei dati

Compatibile con tutto

Il CSV risultante e importabile in Excel, Google Sheets, pandas, R, Power BI o qualsiasi strumento dati.

100% privato

Il tuo XML, che puo contenere dati aziendali riservati, viene elaborato solo nel tuo browser.

Estrazione intelligente

Rileva automaticamente le righe, appiattisce le strutture annidate con la notazione a punto e concatena gli array.

Istantaneo

Conversione in tempo reale senza caricare file su alcun server. Nessuna registrazione, nessun limite.

Tre passaggi, senza complicazioni

1

Incolla il tuo XML

Inserisci il contenuto XML: puo essere una risposta SOAP, un feed RSS, un file di configurazione o qualsiasi XML con dati ripetuti.

2

Rilevamento automatico delle righe

Lo strumento individua gli elementi fratelli ripetuti (il livello che rappresenta le righe) ed estrae tutti i campi come colonne CSV.

3

Scarica il CSV

Copia o scarica il CSV risultante. Compatibile con Excel, Google Sheets, pandas e qualsiasi strumento di analisi dati.

Hai delle domande?

Lo strumento analizza l'XML e cerca il livello degli elementi fratelli ripetuti: se esistono piu elementi come product, item, record o simili allo stesso livello, vengono trattati come righe. L'algoritmo identifica l'elemento che appare piu frequentemente come candidato riga. Ad esempio, in un XML inventario strutturato come inventory con products al suo interno e piu product annidati, gli elementi product sono le righe. I campi all'interno di ogni product diventano colonne CSV. Anche gli attributi XML vengono inclusi come colonne.

Le colonne CSV derivano dall'unione di tutti i campi trovati negli elementi riga. Se il primo product ha i campi id, name e price, ma il secondo ha anche stock, il CSV includera tutte e quattro le colonne (id, name, price, stock) e le celle prive di valore per quell'elemento vengono lasciate vuote. Questo garantisce che nessun campo vada perso anche se non tutti gli elementi hanno gli stessi campi, situazione comune in XML reali dove alcuni campi sono opzionali.

Per gli elementi figlio delle righe che sono semplici oggetti annidati, lo strumento usa la notazione con punto per appiattire la struttura: address con city uguale a Madrid diventa la colonna address.city con valore Madrid. Per i sotto-array (piu elementi dello stesso tipo all'interno di una riga), vengono concatenati con un separatore (;) in una singola colonna: tags con due tag A e B diventa tags uguale ad A;B. Questo massimizza le informazioni conservate nel formato tabulare.

Lo standard CSV (RFC 4180) richiede che i campi contenenti virgole, virgolette doppie o interruzioni di riga siano racchiusi tra virgolette doppie. Le virgolette doppie all'interno del valore vengono scappate raddoppiandole. Questo strumento segue lo standard RFC 4180 per garantire che il CSV risultante sia importabile correttamente in Excel, Google Sheets e qualsiasi parser CSV. I valori con virgole (comuni nei dati XML che possono contenere elenchi) e i valori con interruzioni di riga (comuni nei campi descrizione) vengono gestiti correttamente.

XML in CSV e particolarmente utile per: 1) Risposte SOAP: i servizi SOAP (molto comuni nei sistemi bancari, ERP e legacy) restituiscono XML. La conversione in CSV facilita l'analisi in Excel o l'importazione in database. 2) Feed RSS e Atom: convertire gli articoli di un feed RSS in CSV per l'analisi dei contenuti o il monitoraggio mediatico. 3) Export di configurazioni: molti sistemi enterprise come SAP, Oracle e Salesforce esportano dati in XML. 4) Workflow ETL: nelle pipeline dati, la trasformazione XML in CSV e un passaggio comune prima del caricamento in un data warehouse.

XML in azienda: SOAP, RSS e SVG, migrazione dati e workflow ETL

XML (eXtensible Markup Language) e stato pubblicato dal W3C nel 1998 e durante gli anni 2000 e diventato il formato standard per lo scambio di dati. SOAP (Simple Object Access Protocol), basato su XML, ha dominato le architetture dei web service fino all'avvento di REST. Oggi un gran numero di sistemi enterprise legacy usa ancora SOAP e XML: SAP, Oracle ERP, sistemi bancari SWIFT, standard sanitari HL7 e FHIR e molti sistemi governativi. Sebbene REST e JSON abbiano sostituito XML nello sviluppo moderno, XML rimane onnipresente nell'integrazione di sistemi enterprise.

RSS (Really Simple Syndication) e Atom sono formati XML per i feed di contenuti web. Sebbene i feed RSS sembrino una tecnologia del passato, sono ancora ampiamente utilizzati dai podcast (iTunes e Apple Podcasts usano RSS per la distribuzione), dai blog, dai portali di notizie e dagli strumenti di monitoraggio mediatico. SVG (Scalable Vector Graphics) e anch'esso XML ed e integrato in HTML5. XML e anche il formato base per XLSX (Excel), DOCX (Word) e PPTX (PowerPoint): questi file sono archivi ZIP che contengono XML internamente.

Nei workflow ETL (Extract, Transform, Load) nel data engineering, la conversione da XML a CSV e una trasformazione molto comune. Apache NiFi, Apache Airflow, dbt e altri strumenti ETL supportano le trasformazioni XML. In Python, le librerie lxml e xml.etree.ElementTree sono i parser XML standard, e pandas puo leggere XML direttamente con pd.read_xml(). Nel contesto della migrazione dati, molti sistemi legacy esportano solo in XML, e la conversione in CSV e il primo passo per importare i dati in sistemi moderni come PostgreSQL, BigQuery o Snowflake.