DokumentyObrazyMediaNarzędzia PDF

Konwerter CSV na TSV Online

Konwertuj CSV na TSV (rozdzielane tabulatorem) bezplatnie, w Twojej przegladarce.

nombre	edad	ciudad
Juan	30	Madrid
Maria	25	Barcelona
Carlos	35	Valencia
Processed in your browser

CSV do TSV dla baz danych i nauki o danych

Import do bazy danych

PostgreSQL COPY i MySQL LOAD DATA uzywaja TSV do masowego ladowania milionow wierszy w sekundy.

Schowek arkusza kalkulacyjnego

Excel i Arkusze Google uzywaja TSV wewnetrznie podczas kopiowania komorek. Wklej TSV bezposrednio do dowolnego arkusza.

Potoki bioinformatyczne

BLAST, bedtools, samtools i narzedzia Galaxy uzywaja TSV jako standardowego formatu wyjsciowego.

W 100% prywatne

Konwersja odbywa sie w Twojej przegladarce. Twoje dane nigdy nie sa wysylane na zaden serwer.

Trzy kroki, żadnych komplikacji

1

Przeslij lub wklej plik CSV

Przeciagnij plik .csv lub wklej zawartosc bezposrednio. Bez limitow wierszy, bez rejestracji.

2

Automatyczna konwersja

Przecinki sa zastepowane tabulatorami z zachowaniem cytowania RFC 4180. Przetwarzanie odbywa sie w Twojej przegladarce.

3

Pobierz lub skopiuj TSV

Otrzymaj plik .tsv gotowy do importu do PostgreSQL, MySQL, Excela lub Arkuszy Google.

Masz pytania?

TSV (Tab-Separated Values) uzywa znaku tabulatora (\t, ASCII 9) jako separatora kolumn, podczas gdy CSV uzywa przecinka. Praktyczna zaleta tabulatorow polega na tym, ze rzadko pojawiaja sie w rzeczywistych danych (imionach, adresach, opisach), co eliminuje potrzebe cytowania pol. Przecinki natomiast czesto pojawiaja sie w tekscie narracyjnym, cenach i wspolrzednych geograficznych, wymagajac logiki eskejpowania RFC 4180. Ta prostota jest powodem, dla ktorego bazy danych i narzedzia naukowe preferuja TSV do masowych eksportow.

PostgreSQL obsluguje COPY table FROM 'file.tsv' DELIMITER E'\t' CSV HEADER — najszybszy mechanizm masowego ladowania danych w tym silniku, zdolny do wstawienia milionow wierszy w sekundy, znacznie wydajniejszy niz INSERT wiersz po wierszu. MySQL oferuje rownowazdne: LOAD DATA INFILE 'file.tsv' FIELDS TERMINATED BY '\t'. Konwersja Twojego CSV na TSV pozwala bezposrednio korzystac z tych polecen o wysokiej wydajnosci.

Gdy kopiujesz zakres komorek w Arkuszach Google lub Excelu, schowek otrzymuje zawartosc w formacie czystego TSV: kolumny rozdzielone tabulatorami, wiersze rozdzielone znakami nowej linii. Oznacza to, ze jesli przekonwertujesz swoj CSV na TSV i skopiujesz wynik, mozesz wkleic go bezposrednio do dowolnej komorki arkusza kalkulacyjnego, a kolumny rozloza sie automatycznie. TSV to natywny format schowka wszystkich glownych aplikacji arkusza kalkulacyjnego.

W CSV pola z przecinkami sa owijane w podwojne cudzystowy (RFC 4180). Przy konwersji do TSV przecinki nie wymagaja juz eskejpowania, bo tabulator jest nowym separatorem. Convertir.ai automatycznie usuwa zbedne otaczajace cudzystowy i zachowuje podwojne cytowanie tylko dla pol zawierajacych literalne tabulatory lub znaki nowej linii, produkujac czysty, standardowy TSV.

Tak, TSV jest de facto standardem w bioinformatyce. BLAST (Basic Local Alignment Search Tool) z opcja -outfmt 6 generuje 12-kolumnowy wynik TSV. Bedtools, samtools, HMMER, GATK i wiekszosc narzedzi Galaxy domyslnie generuje TSV. Pliki BED, GFF3, VCF i GTF to takze warianty TSV. Jesli otrzymujesz dane sekwencjonowania w formacie CSV i musisz przetworzyc je tymi narzedzami, konwersja na TSV jest pierwszym krokiem.

Nie, o ile wartosci pol nie zawieraja literalnych znakow tabulatora. Convertir.ai wykrywa ten przypadek graniczny: jesli pole CSV zawiera tabulator, ostrzega Cie, bo ten znak kolidowalby z separatorem TSV. W praktyce literalne tabulatory w rzeczywistych danych sa niezwykle rzadkie. Wszystkie wartosci, naglowki i wiersze sa zachowywane w calosci.

Konwertuj CSV na TSV: bazy danych, arkusze kalkulacyjne i bioinformatyka

CSV (Comma-Separated Values) i TSV (Tab-Separated Values) to dwa najszerzej uzywane formaty danych tabelarycznych w formatach zwyklego tekstu w informatyce, a roznica miedzy nimi to jeden znak: przecinek kontra tabulator (\t, kod ASCII 9, Unicode U+0009). Pomimo ich pozornej prostoty, ta roznica ma znaczace praktyczne implikacje dla sposobu, w jaki systemy przetwarzaja, eskejpuja i waliduja dane. Przecinek jest znakiem, ktory czesto pojawia sie w tekscie narracyjnym, cenach z separatorem tysiecy, wspolrzednych geograficznych, wyliczeniach i nazwiskach w formacie nazwisko-imie. Ta wszechobecnosc zmusza CSV do wymagania systemu cytowania i eskejpowania zdefiniowanego przez IETF w RFC 4180 (pazdziernik 2005). Znak tabulatora natomiast prawie nigdy nie pojawia sie w rzeczywistych danych tekstowych, co sprawia, ze TSV jest prostszy do generowania i parsowania bez jakiejkolwiek logiki eskejpowania w zdecydowanej wiekszosci przypadkow. Ta strukturalna prostota jest wlasnie powodem, dla ktorego systemy wysokiej wydajnosci, takie jak PostgreSQL, MySQL, Apache Hive i Amazon Redshift, preferuja TSV do operacji masowego ladowania, gdzie parsowanie milionow wierszy przy minimalnym nakladzie robi mierzalna roznice w wydajnosci.

Najwazniejszy przypadek uzycia konwersji CSV do TSV w srodowiskach produkcyjnych to import do relacyjnych baz danych na duza skale. PostgreSQL dostarcza polecenie COPY — najszybszy mechanizm pobierania w silniku, zdolny do roznienia sie o do dwoch rzedow wielkosci w przepustowosci w porownaniu z poleceniami INSERT wiersz po wierszu. Pelna skladnia to COPY table_name FROM '/absolute/path/file.tsv' DELIMITER E'\t' CSV HEADER, gdzie klauzula CSV HEADER mowi silnikowi, ze pierwszy wiersz zawiera nazwy kolumn, a nie dane. PostgreSQL obsluguje rowniez strumieniowanie ze stdin dla przeplywe potokowych: psql -c "COPY table FROM STDIN DELIMITER E'\t' CSV HEADER". MySQL oferuje rownowazdne LOAD DATA INFILE 'file.tsv' INTO TABLE table_name FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' IGNORE 1 ROWS. Big data, takie jak Apache Hive, Apache Spark i Amazon Redshift, maja natywna, zoptymalizowana obsluge TSV w ich sciezkach masowego ladowania. Powodem tej lepszej wydajnosci jest brak koniecznosci utrzymywania stanu o tym, czy parser znajduje sie wewnatrz cytowanego pola, co radykalnie upraszcza automat parsujacy i pozwala na wyzsza przepustowosc przetwarzania na rdzen przy skali.

Drugim wartosciowym przypadkiem uzycia konwersji CSV do TSV jest integracja ze schowkiem arkusza kalkulacyjnego. Gdy zaznaczasz zakres komorek w Microsoft Excel lub Arkuszach Google i kopiujesz przez Ctrl+C (Cmd+C na Macu), zawartosc umieszczona w schowku systemu operacyjnego to czysty TSV: kolumny rozdzielone znakami tabulatora (U+0009), wiersze rozdzielone CRLF (U+000D U+000A) w Windows lub LF (U+000A) na macOS i Linux. To zachowanie jest udokumentowane w specyfikacji formatu schowka Microsoftu dla CF_TEXT. LibreOffice Calc i Apple Numbers uzywaja tego samego formatu schowka dla zakresow komorek, co sprawia, ze TSV jest powszechnym formatem kompatybilnym z wklejaniem we wszystkich glownych aplikacjach arkusza kalkulacyjnego. W bioinformatyce i biologii obliczeniowej TSV jest de facto standardem wymiany danych: tabelaryczny format wyjscia BLAST (-outfmt 6) generuje 12-kolumnowy TSV z wyrownaniami sekwencji; bedtools, samtools view, HMMER (hmmscan --tblout) i GATK VariantAnnotator domyslnie generuja TSV; formaty BED, GFF3, VCF i GTF to warianty TSV ze specyfikacyjnie zdefiniowanymi kolumnami. Jesli otrzymujesz dane eksperymentalne w CSV i musisz przetworzyc je tymi narzedzami bioinformatycznymi, konwersja na TSV jest obowiazkowym pierwszym krokiem potoku.