Convertir XML a CSV
Extrae datos de XML a CSV en tu navegador, sin instalar nada.
.pdf · hasta 2 GB
Para qué sirve
XML a CSV para análisis de datos
Compatible con todo
CSV resultante importable en Excel, Google Sheets, pandas, R, Power BI o cualquier herramienta de datos.
100% privado
Tu XML (que puede contener datos empresariales confidenciales) se procesa solo en tu navegador.
Extracción inteligente
Detecta filas automáticamente, aplana estructuras anidadas con notación de puntos, concatena arrays.
Instantáneo
Conversión en tiempo real sin subir archivos a ningún servidor. Sin registro, sin límites.
Cómo funciona
Tres pasos, sin complicaciones
Pega tu XML
Pega el contenido XML: puede ser una respuesta SOAP, un feed RSS, un archivo de configuración o cualquier XML con datos repetidos.
Detección automática de filas
La herramienta detecta los elementos hermanos repetidos (el nivel que representa filas) y extrae todos los campos como columnas CSV.
Descarga el CSV
Copia o descarga el CSV resultante. Compatible con Excel, Google Sheets, pandas, y cualquier herramienta de análisis de datos.
Preguntas frecuentes
¿Tienes dudas?
La herramienta analiza el XML y busca el nivel de elementos hermanos repetidos: si hay múltiples elementos <product>, <item>, <record> o similares al mismo nivel, se tratan como filas. El algoritmo identifica el elemento que aparece más veces como candidato a fila. Por ejemplo, en un XML de inventario con <inventory><products><product>...</product><product>...</product></products></inventory>, los elementos <product> son las filas. Los campos dentro de cada <product> se convierten en columnas del CSV. Los atributos XML también se incluyen como columnas.
Las columnas del CSV se derivan de la unión de todos los campos encontrados en todos los elementos fila. Si el primer <product> tiene campos id, name y price, pero el segundo también tiene stock, el CSV incluirá las cuatro columnas (id, name, price, stock) y las celdas sin valor para ese elemento quedan vacías. Esto garantiza que no se pierda ningún campo aunque no todos los elementos tengan los mismos campos, lo cual es común en XML del mundo real donde algunos campos son opcionales.
Para los elementos hijos de las filas que son objetos anidados simples, la herramienta usa notación con punto para aplanar la estructura: <address><city>Madrid</city></address> se convierte en la columna address.city con valor Madrid. Para sub-arrays (múltiples elementos del mismo tipo dentro de una fila), se concatenan con un separador (;) en una sola columna: <tags><tag>A</tag><tag>B</tag></tags> se convierte en tags = A;B. Esto maximiza la información preservada en un formato tabular.
El estándar CSV (RFC 4180) requiere que los campos que contengan comas, comillas dobles o saltos de línea se envuelvan en comillas dobles. Las comillas dobles dentro del valor se escapan duplicándolas (""). Esta herramienta sigue el estándar RFC 4180 para garantizar que el CSV resultante sea importable correctamente en Excel, Google Sheets y cualquier parser CSV. Los valores con comas (frecuentes en datos XML que pueden contener listas) y los valores con saltos de línea (frecuentes en campos de descripción) se gestionan correctamente.
XML a CSV es especialmente útil para: 1) Respuestas SOAP: los servicios SOAP (muy comunes en sistemas bancarios, ERP y sistemas legacy) retornan XML. Convertir a CSV facilita el análisis en Excel o la importación a bases de datos. 2) Feeds RSS/Atom: convertir artículos de feeds RSS a CSV para análisis de contenido o monitoreo de medios. 3) Exportaciones de configuración: muchos sistemas empresariales (SAP, Oracle, Salesforce) exportan datos en XML. 4) Flujos ETL: en pipelines de datos, XML a CSV es un paso de transformación común antes de cargar a un data warehouse.
XML en la empresa: SOAP, RSS y SVG, migración de datos, y flujos ETL
XML (eXtensible Markup Language) fue publicado por el W3C en 1998 y durante los años 2000 se convirtió en el formato estándar para intercambio de datos. SOAP (Simple Object Access Protocol), basado en XML, dominó las arquitecturas de servicios web hasta la llegada de REST. Hoy, una gran cantidad de sistemas empresariales legacy siguen usando SOAP y XML: SAP, Oracle ERP, sistemas bancarios SWIFT, estándares de salud HL7 y FHIR, y muchos sistemas gubernamentales. Aunque REST y JSON han reemplazado a XML en el desarrollo moderno, XML sigue siendo omnipresente en la integración de sistemas empresariales.
RSS (Really Simple Syndication) y Atom son formatos XML para feeds de contenido web. Aunque los feeds RSS parecen una tecnología del pasado, siguen siendo ampliamente usados por podcasts (iTunes/Apple Podcasts usa RSS para distribución), blogs, portales de noticias y herramientas de monitoreo de medios. SVG (Scalable Vector Graphics) también es XML y está integrado en HTML5. XML también es el formato base de XLSX (Excel), DOCX (Word) y PPTX (PowerPoint): estos archivos son archivos ZIP que contienen XML internamente.
En los flujos ETL (Extract, Transform, Load) de ingeniería de datos, XML a CSV es una transformación muy común. Apache NiFi, Apache Airflow, dbt y otras herramientas ETL soportan transformaciones XML. En Python, las bibliotecas lxml y xml.etree.ElementTree son los parsers XML estándar, y pandas puede leer XML directamente con pd.read_xml(). En el contexto de migración de datos, muchos sistemas legados solo exportan en XML, y la conversión a CSV es el primer paso para importar datos a sistemas modernos como PostgreSQL, BigQuery o Snowflake.