Konwertuj XML na CSV Online
Wyodrębniaj dane z XML do CSV w przeglądarce — bez instalowania czegokolwiek.
.pdf · do 2 GB
Do czego służy
XML na CSV do analizy danych
Kompatybilny ze wszystkim
Wynikowy CSV importowalny w Excel, Google Sheets, pandas, R, Power BI lub dowolnym narzędziu do danych.
100% prywatne
Twój XML (który może zawierać poufne dane biznesowe) jest przetwarzany wyłącznie w Twojej przeglądarce.
Inteligentne wyodrębnianie
Automatycznie wykrywa wiersze, spłaszcza zagnieżdżone struktury notacją kropkową, łączy tablice.
Natychmiast
Konwersja w czasie rzeczywistym bez przesyłania plików na jakikolwiek serwer. Bez rejestracji, bez limitów.
Jak to działa
Trzy kroki, żadnych komplikacji
Wklej swój XML
Wklej zawartość XML: może to być odpowiedź SOAP, kanał RSS, plik konfiguracyjny lub dowolny XML z powtarzającymi się danymi.
Automatyczne wykrywanie wierszy
Narzędzie wykrywa powtarzające się elementy siostrzane (poziom reprezentujący wiersze) i wyodrębnia wszystkie pola jako kolumny CSV.
Pobierz CSV
Skopiuj lub pobierz wynikowy CSV. Kompatybilny z Excel, Google Sheets, pandas i każdym narzędziem do analizy danych.
FAQ
Masz pytania?
Narzędzie analizuje XML i szuka poziomu powtarzających się elementów siostrzanych: jeśli na tym samym poziomie znajduje się wiele elementów <product>, <item>, <record> lub podobnych, są traktowane jako wiersze. Algorytm identyfikuje element pojawiający się najczęściej jako kandydata na wiersz. Na przykład w XML inwentarza z <inventory><products><product>...</product><product>...</product></products></inventory> elementy <product> są wierszami. Pola wewnątrz każdego <product> stają się kolumnami CSV. Atrybuty XML są również dołączane jako kolumny.
Kolumny CSV powstają z unii wszystkich pól znalezionych we wszystkich elementach wierszy. Jeśli pierwszy <product> ma pola id, name i price, ale drugi ma też stock, CSV zawiera wszystkie cztery kolumny (id, name, price, stock), a komórki bez wartości dla danego elementu są puste. Dzięki temu żadne pole nie jest tracone, nawet jeśli nie wszystkie elementy mają te same pola — co jest typowe w rzeczywistych plikach XML z opcjonalnymi polami.
Dla elementów podrzędnych wierszy będących prostymi zagnieżdżonymi obiektami narzędzie używa notacji kropkowej do spłaszczenia struktury: <address><city>Warszawa</city></address> staje się kolumną address.city z wartością Warszawa. Dla podtablic (wiele elementów tego samego typu w wierszu) są one łączone separatorem (;) w jednej kolumnie: <tags><tag>A</tag><tag>B</tag></tags> staje się tags = A;B. Maksymalizuje to informacje zachowane w formacie tabelarycznym.
Standard CSV (RFC 4180) wymaga, aby pola zawierające przecinki, cudzysłowy lub znaki nowej linii były otoczone cudzysłowami. Cudzysłowy wewnątrz wartości są escapowane przez podwojenie (""). Narzędzie przestrzega standardu RFC 4180, aby wynikowy CSV był poprawnie importowalny w Excel, Google Sheets i dowolnym parserze CSV. Wartości z przecinkami (typowe w danych XML mogących zawierać listy) i z podziałami wiersza (typowe w polach opisów) są obsługiwane poprawnie.
XML na CSV jest szczególnie przydatny dla: 1) Odpowiedzi SOAP: usługi SOAP (bardzo powszechne w systemach bankowych, ERP i starszych systemach) zwracają XML. Konwersja do CSV ułatwia analizę w Excel lub import do baz danych. 2) Kanały RSS/Atom: konwersja artykułów z kanałów RSS do CSV do analizy treści lub monitorowania mediów. 3) Eksporty konfiguracji: wiele systemów korporacyjnych (SAP, Oracle, Salesforce) eksportuje dane w XML. 4) Przepływy ETL: w potokach danych XML na CSV to powszechny krok transformacji przed ładowaniem do hurtowni danych.
XML w przedsiębiorstwach: SOAP, RSS i SVG, migracja danych i przepływy ETL
XML (eXtensible Markup Language) został opublikowany przez W3C w 1998 i w latach 2000. stał się standardowym formatem wymiany danych. SOAP (Simple Object Access Protocol), oparty na XML, dominował w architekturach usług sieciowych do czasu pojawienia się REST. Dziś duża liczba starszych systemów korporacyjnych nadal używa SOAP i XML: SAP, Oracle ERP, bankowe systemy SWIFT, standardy zdrowotne HL7 i FHIR oraz wiele systemów rządowych. Choć REST i JSON zastąpiły XML w nowoczesnym tworzeniu oprogramowania, XML pozostaje wszechobecny w integracji systemów korporacyjnych.
RSS (Really Simple Syndication) i Atom to formaty XML dla kanałów treści webowych. Choć kanały RSS wydają się technologią przeszłości, są nadal szeroko stosowane przez podcasty (iTunes/Apple Podcasts używa RSS do dystrybucji), blogi, portale informacyjne i narzędzia do monitorowania mediów. SVG (Scalable Vector Graphics) to również XML i jest zintegrowany z HTML5. XML jest też bazowym formatem dla XLSX (Excel), DOCX (Word) i PPTX (PowerPoint): pliki te to archiwa ZIP zawierające wewnętrznie XML.
W przepływach ETL (Extract, Transform, Load) w inżynierii danych XML na CSV jest bardzo powszechną transformacją. Apache NiFi, Apache Airflow, dbt i inne narzędzia ETL obsługują transformacje XML. W Python biblioteki lxml i xml.etree.ElementTree są standardowymi parserami XML, a pandas może odczytywać XML bezpośrednio przez pd.read_xml(). W kontekście migracji danych wiele starszych systemów eksportuje jedynie w XML, a konwersja do CSV to pierwszy krok importowania danych do nowoczesnych systemów jak PostgreSQL, BigQuery lub Snowflake.