TSV (значения, разделённые табуляцией)
TSV (Tab-Separated Values) — текстовый формат для табличных данных, где поля разделены символами табуляции вместо запятых. TSV позволяет избежать сложностей экранирования запятых в CSV, что делает его особенно удобным для научных данных и текста, содержащего запятые.
MIME-тип
text/tab-separated-values
Тип
Текст
Сжатие
Без потерь
Преимущества
- + Simpler parsing than CSV — no quoting rules needed
- + Tabs rarely appear in data, reducing ambiguity
- + Standard in bioinformatics and scientific data pipelines
Недостатки
- − Less universally recognized than CSV in business tools
- − Cannot represent values containing tab characters
- − Some spreadsheet tools default to CSV, not TSV
Когда использовать .TSV
Используйте TSV для научных данных, при экспорте электронных таблиц с текстом, содержащим запятые, и в ситуациях, где простой разбор строк предпочтительнее обработки экранирования CSV.
Технические детали
Файлы TSV используют символ горизонтальной табуляции (U+0009) в качестве разделителя полей и перевод строки в качестве разделителя записей. В отличие от CSV, TSV обычно не использует кавычки, так как символы табуляции редко встречаются в данных. Это делает парсинг проще — достаточно простого разбиения по табуляции.
История
Разделение табуляцией использовалось с первых дней обработки данных на мейнфреймах. TSV был формализован организацией IANA в качестве MIME-типа text/tab-separated-values. Формат остаётся популярным в биоинформатике, лингвистике и аналитике.