Конвертировать XML в CSV Онлайн
Извлекайте данные из XML в CSV прямо в браузере — без установки программ.
.pdf · до 2 ГБ
Для чего это нужно
XML в CSV для анализа данных
Совместим со всем
Итоговый CSV импортируется в Excel, Google Sheets, pandas, R, Power BI или любой инструмент работы с данными.
100% приватно
Ваш XML (который может содержать конфиденциальные бизнес-данные) обрабатывается только в вашем браузере.
Умное извлечение
Автоматически определяет строки, «сплющивает» вложенные структуры с точечной нотацией, конкатенирует массивы.
Мгновенно
Конвертация в реальном времени без загрузки файлов на серверы. Никакой регистрации и ограничений.
Как это работает
Три шага — никаких сложностей
Вставьте ваш XML
Вставьте XML-содержимое: SOAP-ответ, RSS-фид, конфигурационный файл или любой XML с повторяющимися данными.
Автоматическое определение строк
Инструмент определяет повторяющиеся дочерние элементы одного уровня (представляющие строки) и извлекает все поля как столбцы CSV.
Скачайте CSV
Скопируйте или скачайте итоговый CSV. Совместим с Excel, Google Sheets, pandas и любым инструментом анализа данных.
FAQ
Остались вопросы?
Инструмент анализирует XML и ищет уровень повторяющихся одноуровневых элементов: если несколько элементов <product>, <item>, <record> или аналогичных находятся на одном уровне, они считаются строками. Алгоритм определяет наиболее часто встречающийся элемент как кандидата на роль строки. Поля внутри каждого элемента становятся столбцами CSV. XML-атрибуты также включаются как столбцы.
Столбцы CSV формируются из объединения всех полей, найденных во всех элементах-строках. Если первый <product> содержит поля id, name и price, а второй также содержит stock, CSV включит все четыре столбца, оставляя ячейки пустыми для элементов без этого поля. Это гарантирует, что ни одно поле не будет потеряно, даже если не все элементы имеют одинаковый набор полей.
Для дочерних элементов строк, являющихся простыми вложенными объектами, инструмент использует точечную нотацию для «сплющивания» структуры: <address><city>Москва</city></address> становится столбцом address.city со значением Москва. Для подмассивов (нескольких элементов одного типа внутри строки) они конкатенируются с разделителем (;) в одном столбце: <tags><tag>A</tag><tag>B</tag></tags> → tags = A;B.
Стандарт CSV (RFC 4180) требует заключать в двойные кавычки поля, содержащие запятые, двойные кавычки или переносы строк. Двойные кавычки внутри значения экранируются их удвоением (""). Данный инструмент следует стандарту RFC 4180, обеспечивая корректный импорт результирующего CSV в Excel, Google Sheets и любой CSV-парсер.
XML в CSV особенно полезен для: 1) SOAP-ответов — SOAP-сервисы (распространены в банковских, ERP и устаревших системах) возвращают XML; конвертация в CSV упрощает анализ в Excel или импорт в базы данных. 2) RSS/Atom-фидов — преобразование статей RSS в CSV для анализа контента. 3) Экспортов конфигурации — многие корпоративные системы (SAP, Oracle, Salesforce) экспортируют данные в XML. 4) ETL-рабочих процессов — в конвейерах данных XML в CSV — распространённый шаг трансформации перед загрузкой в хранилище данных.
XML в корпоративном мире: SOAP, RSS и SVG, миграция данных и ETL-рабочие процессы
XML (eXtensible Markup Language) был опубликован W3C в 1998 году и в 2000-е годы стал стандартным форматом обмена данными. SOAP (Simple Object Access Protocol) на основе XML доминировал в архитектурах веб-сервисов до появления REST. Сегодня значительное число корпоративных устаревших систем по-прежнему используют SOAP и XML: SAP, Oracle ERP, банковские системы SWIFT, стандарты здравоохранения HL7 и FHIR, многие государственные системы.
RSS (Really Simple Syndication) и Atom — XML-форматы для веб-фидов контента. Несмотря на то что RSS-фиды кажутся технологией прошлого, они по-прежнему широко используются подкастами (iTunes/Apple Podcasts использует RSS для дистрибуции), блогами, новостными порталами и инструментами мониторинга СМИ. SVG (Scalable Vector Graphics) также является XML и интегрирован в HTML5. XML — базовый формат для XLSX (Excel), DOCX (Word) и PPTX (PowerPoint): эти файлы представляют собой ZIP-архивы, внутри которых содержится XML.
В ETL-рабочих процессах в области data engineering трансформация XML в CSV весьма распространена. Apache NiFi, Apache Airflow, dbt и другие ETL-инструменты поддерживают XML-трансформации. В Python библиотеки lxml и xml.etree.ElementTree являются стандартными XML-парсерами, а pandas может читать XML напрямую с помощью pd.read_xml(). В контексте миграции данных многие устаревшие системы экспортируют только в XML, и конвертация в CSV — первый шаг для импорта данных в современные системы, такие как PostgreSQL, BigQuery или Snowflake.