Чем формат CSV отличается от формата TSV?

Choosing between tsv and csv I have a program that outputs a table, and I was wondering if there are any advantages/disadvantages between the csv and tsv formats. 5 Answers 5 TSV is a very

Чем формат CSV отличается от формата TSV?

Choosing between tsv and csv

I have a program that outputs a table, and I was wondering if there are any advantages/disadvantages between the csv and tsv formats.

5 Answers 5

TSV is a very efficient for Javascript/Perl/Python to process, without losing any typing information, and also easy for humans to read.

The format has been supported in 4store since its public release, and it’s reasonably widely used.

The way I look at it is: CSV is for loading into spreadsheets, TSV is for processing by bespoke software.

The choice depends on the application. In a nutshell, if your fields don’t contain commas, use CSV; otherwise TSV is the way to go.

TL;DR

In both formats, the problem arises when the delimiter can appear within the fields, so it is necessary to indicate that the delimiter is not working as a field separator but as a value within the field, which can be somewhat painful.

For example, using CSV: Kalman, Rudolf , von Neumann, John , Gabor, Dennis

Delete all the delimiters that appear within the field.

E.g. Kalman Rudolf , von Neumann John , Gabor Dennis

Escape the character (usually pre-appending a backslash ).

E.g. Kalman, Rudolf , von Neumann, John , Gabor, Dennis

Enclose each field with other character (usually double quotes » ).

E.g. «Kalman, Rudolf» , «von Neumann, John» , «Gabor, Dennis»

The fields are separated by a comma , .

  • It is more generic and useful when sharing with non-technical people, as most of software packages can read it without playing with the settings.
  • Escaping the comma within the fields can be frustrating because not everybody follows the standards.
  • All the extra escaping characters and quotes add weight to the final file size.

The fields are separated by a tabulation or t

  • It is not necessary to escape the delimiter as it is not usual to have the tab-character within a field. Otherwise, it should be removed.
  • It is less widespread.

You can use any delimiter you want, but tabs and commas are supported by many applications, including Excel, MySQL, PostgreSQL. Commas are common in text fields, so if you escape them, more of them need to be escaped. If you don’t escape them and your fields might contain commas, then you can’t confidently run «sort -k2,4» on your file. You might need to escape some characters in fields anyway (null bytes, newlines, etc.). For these reasons and more, my preference is to use TSVs, and escape tabs, null bytes, and newlines within fields. Additionally, it is usually easier to work with TSVs. Just split each line by the tab delimiter. With CSVs there are quoted fields, possibly fields with newlines, etc. I only use CSVs when I’m forced to.

I think that generally csv, are supported more often than the tsv format.

TSV-utils makes an interesting comparison, copied here after. In a nutshell, use TSV.

Comparing TSV and CSV formats

The differences between TSV and CSV formats can be confusing. The obvious distinction is the default field delimiter: TSV uses TAB, CSV uses comma. Both use newline as the record delimiter.

By itself, using different field delimiters is not especially significant. Far more important is the approach to delimiters occurring in the data. CSV uses an escape syntax to represent comma and newlines in the data. TSV takes a different approach, disallowing TABs and newlines in the data.

The escape syntax enables CSV to fully represent common written text. This is a good fit for human edited documents, notably spreadsheets. This generality has a cost: reading it requires programs to parse the escape syntax. While not overly difficult, it is still easy to do incorrectly, especially when writing one-off programs. It is good practice is to use a CSV parser when processing CSV files. Traditional Unix tools like cut , sort , awk , and diff do not process CSV escapes, alternate tools are needed.

By contrast, parsing TSV data is simple. Records can be read using the typical readline routines found in most programming languages. The fields in each record can be found using split routines. Unix utilities can be called by providing the correct field delimiter, e.g. awk -F «t» , sort -t $’t’ . No special parser is needed. This is much more reliable. It is also faster, no CPU time is used parsing the escape syntax.

The speed advantages are especially pronounced for record oriented operations. Record counts ( wc -l ), deduplication ( uniq , tsv-uniq), file splitting ( head , tail , split ), shuffling (GNU shuf , tsv-sample), etc. TSV is faster because record boundaries can be found using highly optimized newline search routines (e.g. memchr ). Identifying CSV record boundaries requires fully parsing each record.

These characteristics makes TSV format well suited for the large tabular data sets common in data mining and machine learning environments. These data sets rarely need TAB and newline characters in the fields.

The most common CSV escape format uses quotes to delimit fields containing delimiters. Quotes must also be escaped, this is done by using a pair of quotes to represent a single quote. Consider the data in this table:

Field-1 Field-2 Field-3
abc hello, world! def
ghi Say «hello, world!» jkl

In Field-2, the first value contains a comma, the second value contain both quotes and a comma. Here is the CSV representation, using escapes to represent commas and quotes in the data.

In the above example, only fields with delimiters are quoted. It is also common to quote all fields whether or not they contain delimiters. The following CSV file is equivalent:

Here’s the same data in TSV. It is much simpler as no escapes are involved:

The similarity between TSV and CSV can lead to confusion about which tools are appropriate. Furthering this confusion, it is somewhat common to have data files using comma as the field delimiter, but without comma, quote, or newlines in the data. No CSV escapes are needed in these files, with the implication that traditional Unix tools like cut and awk can be used to process these files. Such files are sometimes referred to as «simple CSV». They are equivalent to TSV files with comma as a field delimiter. Traditional Unix tools and tsv-utils tools can process these files correctly by specifying the field delimiter. However, «simple csv» is a very ad hoc and ill defined notion. A simple precaution when working with these files is to run a CSV-to-TSV converter like csv2tsv prior to other processing steps.

Note that many CSV-to-TSV conversion tools don’t actually remove the CSV escapes. Instead, many tools replace comma with TAB as the record delimiter, but still use CSV escapes to represent TAB, newline, and quote characters in the data. Such data cannot be reliably processed by Unix tools like sort , awk , and cut . The csv2tsv tool in tsv-utils avoids escapes by replacing TAB and newline with a space (customizable). This works well in the vast majority of data mining scenarios.

To see what a specific CSV-to-TSV conversion tool does, convert CSV data containing quotes, commas, TABs, newlines, and double-quoted fields. For example:

Approaches that generate CSV escapes will enclose a number of the output fields in double quotes.

  • Wikipedia: Tab-separated values — Useful description of TSV format.
  • IANA TSV specification — Formal definition of the tab-separated-values mime type.
  • Wikipedia: Comma-separated-values — Describes CSV and related formats.
  • RFC 4180 — IETF CSV format description, the closest thing to an actual standard for CSV.
  • brendano/tsvutils: The philosophy of tsvutils — Brendan O’Connor’s discussion of the rationale for using TSV format in his open source toolkit.
  • So You Want To Write Your Own CSV code? — Thomas Burette’s humorous, and accurate, blog post describing the troubles with ad-hoc CSV parsing. Of course, you could use TSV and avoid these problems!

Чем формат CSV отличается от формата TSV?

Comparing TSV and CSV formats

The differences between TSV and CSV formats can be confusing. The obvious distinction is the default field delimiter: TSV uses TAB, CSV uses comma. Both use newline as the record delimiter.

By itself, using different field delimiters is not especially significant. Far more important is the approach to delimiters occurring in the data. CSV uses an escape syntax to represent commas and newlines in the data. TSV takes a different approach, disallowing TABs and newlines in the data.

The escape syntax enables CSV to fully represent common written text. This is a good fit for human edited documents, notably spreadsheets. This generality has a cost: reading it requires programs to parse the escape syntax. While not overly difficult, it is still easy to do incorrectly, especially when writing one-off programs. It is good practice to use a CSV parser when processing CSV files. Traditional Unix tools like cut , sort , awk , and diff do not process CSV escapes, alternate tools are needed.

By contrast, parsing TSV data is simple. Records can be read using the typical readline routines found in most programming languages. The fields in each record can be found using split routines. Unix utilities can be called by providing the correct field delimiter, e.g. awk -F «t» , sort -t $’t’ . No special parser is needed. This is much more reliable. It is also faster, no CPU time is used parsing the escape syntax.

The speed advantages are especially pronounced for record oriented operations. Record counts ( wc -l ), deduplication ( uniq , tsv-uniq), file splitting ( head , tail , split ), shuffling (GNU shuf , tsv-sample), etc. TSV is faster because record boundaries can be found using highly optimized newline search routines (e.g. memchr ). Identifying CSV record boundaries requires fully parsing each record.

These characteristics make TSV format well suited for the large tabular data sets common in data mining and machine learning environments. These data sets rarely need TAB and newline characters in the fields.

The most common CSV escape format uses quotes to delimit fields containing delimiters. Quotes must also be escaped, this is done by using a pair of quotes to represent a single quote. Consider the data in this table:

Field-1 Field-2 Field-3
abc hello, world! def
ghi Say «hello, world!» jkl

In Field-2, the first value contains a comma, the second value contains both quotes and a comma. Here is the CSV representation, using escapes to represent commas and quotes in the data.

In the above example, only fields with delimiters are quoted. It is also common to quote all fields whether or not they contain delimiters. The following CSV file is equivalent:

Here’s the same data in TSV. It is much simpler as no escapes are involved:

The similarity between TSV and CSV can lead to confusion about which tools are appropriate. Furthering this confusion, it is somewhat common to have data files using comma as the field delimiter, but without comma, quote, or newlines in the data. No CSV escapes are needed in these files, with the implication that traditional Unix tools like cut and awk can be used to process these files. Such files are sometimes referred to as «simple CSV». They are equivalent to TSV files using comma as the field delimiter. Traditional Unix tools and tsv-utils tools can process these files correctly by specifying the field delimiter. However, «simple csv» is a very ad hoc and ill defined notion. A simple precaution when working with these files is to run a CSV-to-TSV converter like csv2tsv prior to other processing steps.

Note that many CSV-to-TSV conversion tools don’t actually remove the CSV escapes. Instead, many tools replace comma with TAB as the record delimiter, but still use CSV escapes to represent TAB, newline, and quote characters in the data. Such data cannot be reliably processed by Unix tools like sort , awk , and cut . The csv2tsv tool in tsv-utils avoids escapes by replacing TAB and newline with a space (customizable). This works well in the vast majority of data mining scenarios.

To see what a specific CSV-to-TSV conversion tool does, convert CSV data containing quotes, commas, TABs, newlines, and double-quoted fields. For example:

Approaches that generate CSV escapes will enclose a number of the output fields in double quotes.

  • Wikipedia: Tab-separated values — Useful description of TSV format.
  • IANA TSV specification — Formal definition of the tab-separated-values mime type.
  • Wikipedia: Comma-separated-values — Describes CSV and related formats.
  • RFC 4180 — IETF CSV format description, the closest thing to an actual standard for CSV.
  • brendano/tsvutils: The philosophy of tsvutils — Brendan O’Connor’s discussion of the rationale for using TSV format in his open source toolkit.
  • So You Want To Write Your Own CSV code? — Thomas Burette’s humorous, and accurate, blog post describing the troubles with ad-hoc CSV parsing. Of course, you could use TSV and avoid these problems!
  • © 2021 GitHub, Inc.
  • Terms
  • Privacy
  • Security
  • Status
  • Docs
  • Contact GitHub
  • Pricing
  • API
  • Training
  • Blog
  • About

You can’t perform that action at this time.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.

Файл формата CSV: чем открыть, описание, особенности

Расширение CSV представляет текстовый вариант электронных таблиц. В статье расскажем об особенностях.

Расширение CSV представляет текстовый вариант электронных таблиц. В статье расскажем об особенностях формата и о том, чем открыть CSV файл на компьютере и смартфоне.

Общее описание формата CSV

Формат, заменяющий таблицы, появился еще в 70-х годах. В документе формата CSV строка файла заменяет строку таблицы. В оригинальной сборке формата разделителем выступает запятая, но в различных ридерах используются символы : ; / . При этом знаки препинания употребляются в кавычках. Табличные ячейки разделяются последовательностью ASCII.

Определенного стандарта формата не существует. Это означает, что в файлах, которые импортируются в приложения, есть тонкие различия. Эти различия нарушают обработку файлов CSV из нескольких источников.

Как и чем открыть файл CSV расширения

Далее рассмотрим, чем открыть CSV формат. Это делается через онлайн-ресурсы, Android-приложения и компьютерный софт.

Просмотр формата CSV онлайн

Обзор ридеров для размера CSV начнем с онлайн-ресурсов. Чтобы открыть CSV онлайн, зайдите на сайт Convert Csv. Далее ваши действия таковы:

  • загрузите файл на главную страницу сайта удобным способом: выберите с компьютера, введите URL-адрес файла или “перетащите” его в специальное поле;
  • задайте параметры разделителей в поле Field Separator;
  • выберите способ отображения: показать на сайте или конвертировать в Excel.

Таблица воспроизведется на сайте в текстовом формате или как таблица Excel.

Второй способ открыть расширение CSV онлайн – сервис Google Таблицы.

  1. Авторизуйтесь в своей учетной записи Google и откройте Google-таблицы. На стартовой странице нажмите значок с папкой.
  2. Укажите тип файла и нажмите «Открыть».
  3. Начнется загрузка файла. После этого таблица откроется на ресурсе. Для разделения ячеек по умолчанию используются запятые.

Открываем файл CSV на компьютере

Рассказываем, чем открыть CSV на компьютере, кроме штатного Microsoft Office Excel.

Подойдет программа CSVed для просмотра и редактуры файлов CSV. Она поддерживает разные символы разделителей. Добавляйте или удаляйте текстовые элементы и ячейки, экспортируйте файл в форматы HTML, Excel, Word, XML. Делайте поиск по тексту, связывайте колонки.

Утилита не поддерживает русский язык, но это не мешает работе. Функции разбиты по разделам, что облегчает управление файлами.

Как открыть формат CSV в Еxcel

Открыть формат CSV напрямую в Еxcel достаточно просто.

  1. Откройте программу Microsoft Excel, кликните Open.
  2. В диалоговом окне внизу справа из списка выберите формат Text Files.
  3. Найдите нужный файл. В программе отобразится новая страница Excel с содержанием документа CSV.

Открываем расширение CSV на Android

Бесплатный вьювер CSV Viewer работает с форматом CSV на устройствах Android. Утилита поддерживает несколько типов разделителей (запятая, точка с запятой, пробел, табуляция), переключение между страницами нажатием на экран. Приложение видит файлы на флешке и загружает из облака.

Какие проблемы встречаются с CSV-файлом

Чтобы расширение CSV корректно открывалось в программах, укажите для файла опцию QUOTE NONNUMERIC. Тогда поля без кавычек трансформируются в числа с точкой.

Если при импорте файла программа выдает ошибку, проверьте кодировку UTF-8. Установите один формат разделителей при загрузке файла в программу. Если из открытого файла пропали цифры, запятые, кавычки, попробуйте открыть заново через функцию «Создать» и «Текстовый документ» (Блокнот).

Предварительно создайте новый документ exl. Загрузите файл в архиватор 7 zip или другой.

  1. Нажмите правой кнопкой мыши на папку с архивом.
  2. В списке выберите «Извлечь файлы».
  3. Отметьте поле «Распаковать» и заменить файлы
  4. Выберите пустой файл и нажмите «Ок».

Формат csv что это такое? Чем открыть csv формат на различных устройствах

Чем открыть csv формат? На этот вопрос мы ответим в статье. Кроме того, рассмотрим, формат csv что это и как им пользоваться. Если вы столкнулись с проблемой открытия данного формата, то с помощью программ и приложений откроете его на любых устройствах.

Формат csv что это простыми словами? Общее описание, немного истории

Здравствуйте, друзья! Сегодня разберем еще один текстовый формат, который называется csv. Название формата может быть знакомо, но многие не знают, как он расшифровывается и чем его открыть.

Итак, формат csv в переводе с английского Comma-Separated Values – это текстовый формат, который представляет собой табличные данные. Простыми словами данный формат работает в Excel, где строки соответствуют тексту, в которых содержатся поля разделенные запятыми (скрин 1).

Данный формат был создан в 2005 году, который заменил стандартные таблицы. Этим форматом пользуются и сейчас, чтобы заполнять документ таблицы различными данными. Но иногда в процессе работы с этим форматом возникают ошибки, которые неизбежно приводят к потере текста или чисел. Далее разберем, какие программы эту ошибку исправляют.

Чем открыть csv формат на компьютере, программы для работы

Итак, чем открыть csv формат? Рассмотрим проверенные программы для компьютера:

  1. Программа Excel. Если вы установили на компьютер офисный пакет Майкрософт Офис, то наверняка в нем есть данная утилита. С помощью этой программы можно запустить csv файл, нажав на него два раза левой кнопкой компьютерной мыши.
  2. Утилита Notepad++ умеет открывать файлы в csv.
  3. Программа Лайбри Офис.
  4. Простой блокнот Microsoft Notepad.
  5. Утилита CSVed. С помощью этой программы можно прочитать документ в csv формате.
  6. Другие программы можете найти в Интернете или на блоге через поиск.

Разберем программу CSVed на практике и откроем в ней csv документ. Несмотря на то, что программа на английском языке, с ней разберется любой пользователь ПК. Сначала скачайте и установите ее на компьютер. Далее нажмите в программе кнопку File затем, Open, чтобы выбрать документ в формате csv с компьютера (скрин 2).

Если после загрузки файла, программа его не откроет, попробуйте открыть документ в блокноте. Для этого нажмите правой кнопкой мыши по файлу, далее «Открыть с помощью» и из меню выберите приложение «Блокнот» (скрин 3).

После этого вы увидите открытый для просмотра документ в формате csv (скрин 4).

Далее откроем данный формат на Андроид, айфон и на специальных сервисах.

Чем открыть csv формат на Андроид

Чтобы открыть csv формат на Андроид, используйте бесплатные приложения:

  • CSV File Viewer;
  • CSV editor;
  • Microsoft Excel: создание таблиц и работа с ними;
  • CSV Simple Viewer;
  • И другие приложения.

Скачать и установить перечисленные программы можно с Плей Маркет. Подробный процесс установки программ здесь описывать не будем, на блоге рассказывали, как это сделать.

Когда установите, например, приложение CSV File Viewer на Андроид, запустите его. Приложение увидит ваши документы csv на Андроид, на которые можно нажать в приложении и посмотреть.

Чем открыть csv формат на айфоне (iOS)

На айфоне также есть возможность открытия формата csv. Для этого можно воспользоваться любым текстовым редактором, скачав его на айфон в качестве приложения. Чтобы скачать приложения используйте магазин АппСторе:

  • CSVReader c помощью этого приложения можно не только читать файлы CSV, но и их редактировать;
  • Contacts to CSV — Export your Phone Contacts;
  • Microsoft Excel и другие программы.

После установки приложения на айфон, откройте в нем для просмотра формат документа csv. Обычно эти программы синхронизируются с устройствами и файлы можно найти через раздел Документы.

Открываем файлы csv онлайн

В Интернете много сервисов, которые открывают csv документы онлайн. Вбейте в поисковой строке браузера, например, «открыть csv онлайн». Далее перейдите на этот ресурс по ссылке – «becsv.com/csv-viewer.php». На странице сервиса нажмите кнопку – «Clear You Sheet», после чего «Обзор» (скрин 5).

Затем находите на рабочем столе компьютера файл формата csv и нажимаете «Открыть», чтобы документ появился в браузере для просмотра.

Кроме этого сервиса, есть Google диск. Чтобы открыть в нем документы csv, нажмите кнопку «Создать», далее «Загрузить файлы». Затем, перенести документ на диск и нажмите на него, чтобы посмотреть в браузере. Вместе с тем, на блоге мы писали статьи о таких сервисах, как Google документы онлайн, Excel онлайн бесплатно работать без регистрации используем Яндекс, они так же работают с таблицами.

Работа на Mac и Linux

Если вы работаете с операционной системой Mac, то можете использовать текстовые редакторы, для просмотра и работы с csv документами:

  • Документы Google;
  • Инструмент таблицы;
  • Офисный пакет Лайбри Офис;
  • Apple Numbers;
  • NeoOffice.

Для OC Linux есть другие программы:

  • Apache OpenOffice;
  • RStudio;
  • Tabulator;
  • OpenRefine.

Устанавливаете те программы, которые вы выбрали. Далее нажимаете в них соответствующую кнопку, которая загрузит документ в формате csv.

Что можно сделать с проблемными csv файлами

Если расширение csv некорректно отображается в программах, необходимо открыть csv документ в программе Excel. Далее нажмите кнопку «Файл», «Сохранить как» и «Другие форматы» (скрин 6).

Выбираете из списка форматов – «Текст Юникода». Затем нажимаете «Сохранить» и снова перезапускаете файл csv.

Также для решения этой проблемы можно использовать программы, которые работают только с csv документами. Если программы вам не помогают, откройте в браузере сервис-конвертер, загрузите на него файл csv. Далее конвертируйте в другой формат и скопируйте данные в другую таблицу.

Заключение

В статье показали на практике, чем открыть csv формат и рассмотрели вопрос, формат csv что это. Теперь вы знаете, как работать с этим форматом. Выбирайте те программы, которые работают именно с csv документами и не будет проблем с открытием файлов.

Файл формата CSV – чем открыть?

Некоторые пользователи впервые столкнулись с подобным расширением файлов и не знают, что это такое и для чего их применяют. Другие пользователи уже некоторое время работают с этим форматом, однако в один момент что-то пошло не так, и не знают, как исправить появившуюся проблему. В данной статье, мы подробно расскажем, что же это за формат, для чего он предназначен, как его создать и каким образом можно открыть, чтобы файл отображался корректно и был читабельным.

Что такое CSV-формат

CSV-формат (comma separated values) – в переводе на русский, дословно означает — значения разделенные запятой. В Соединенных Штатах Америки значения действительно разделены запятой, однако на территории стран СНГ разделителем может служить не только запятая, чаще всего это точка с запятой, также встречаются пробелы, знаки табуляции, запятая и не только. На самом деле, это не играет особой роли, так как, если использовать специальные программы для открытия файлов этого формата, в них предусмотрены различные настройки, и пользователь даже не будет об этом задумываться.

Что представляет собой csv-формат? Это обычный текстовый файл, который можно открыть при помощи блокнота, Word или Excel. Это очень популярный формат, зачастую его используют для создания табличных данных и обмена ими. Также пользователи могут столкнуться с проблемой корректного отображения файлов в редакторе. Если открыть такой файл при помощи стандартных программ, они могут неправильно распознать кодировку и результаты будут представлены просто набором букв, цифр или символов.

Он существует уже достаточно давно, более сорока лет. И за это время он никак не утратил популярности в связи со своей простотой и удобством. Зачастую свое применение он находит в бизнесе. Единственной проблемой является то, что для работы с ним будет недостаточно текстового редактора. Конечно, можно использовать только его, но это займет очень много времени в отдельных случаях.

Например, для простых таблиц сложностей у пользователя не возникнет вообще, но если нужно работать с более сложными – поля разной длины, большое количество строк и так далее, тогда могут возникнуть сложности и лучше применить специальные программы для открытия этих файлов. Более подробно такие программы разберем в разделе ниже.

Как создать и чем открыть CSV-файл

В сети интернет существует огромное множество различного программного обеспечения для открытия этих файлов, конечно, нет смысла рассматривать их все. Разберем подробно несколько наиболее популярных способов работы с cvs-форматом.

Libre Office

Это абсолютно бесплатная программа и при том довольно проста в обращении, рассмотрим, какие шаги потребуется выполнить для ее использования:

  • Установив программу на свой компьютер, находим нужный csv-файл, кликаем правой кнопкой мыши по нему и в появившемся меню выбираем «Открыть с помощью LibreOffice Calc».
  • Далее откроется меню программы, в котором текст распознается автоматически.
  • Стоит проверить, корректно ли отображена таблица, она находится в нижней части окна.
  • Если что-то пошло не так, обратите внимание на 2 параметра – это кодировка текста, пункт меню «Character set». Должно быть указано «UTF-8».

Второй пункт – это разделитель «Separator Options». Здесь важно выбрать корректный разделитель, который используется в самом тексте. Для этого отмечаем «Separated by» и ниже выставляем галочки на те варианты разделения, которые точно присутствуют в тексте. Например, Comma – запятая, Tab – знак табуляции, Space – пробел и так далее.

  • После чего останется нажать «ОК» и работать с нужным файлом в виде таблицы.
  • Это очень удобная программа, которая может заменить стандартный офисный пакет программ, однако для тех, кто не хочет разбираться с новым программным обеспечением, рекомендуется использовать ее только для открытия csv-формата.

    Open Office Calc

    Этот редактор csv схож с предыдущей программой по своему функционалу. Для начала потребуется скачать пакет Open Office (OO). После установки на компьютер поступит предложение от него стать основной программой для открытия документов. Крайне не рекомендуется подтверждать это действие, так как пользователи, которые привыкли работать с офисными приложениями от Microsoft, могут получить некоторые неудобства. Хоть программа и многофункциональна, но разбираться в ней придется с нуля. Лучшим вариантом будет назначить ее именно на открытие файлов csv. Принцип работы не отличается от прошлой программы:

    • Находим нужный файл, открываем при помощи приложения и попадаем в меню.
    • Смотрим на таблицу внизу, корректно ли она отображена.
    • Далее обращаем внимание на пункт «Кодировка», выставляется он автоматически, однако проверьте, совпадает ли с документом.

  • Также задаем параметры разделителя, отмечаем галочкой в зависимости от того, какой используется в файле – «Табуляция», «Запятая», «Точка с запятой», «Пробел» и так далее.
  • Обращаем внимание на пункт «Разделитель текста» оставляем его пустым.
  • Раздел «Поля» можно оставить стандартно или выбрать тип «Текст».
  • Подводным камнем может стать выбор неправильного разделителя или нескольких. В таком случае файл может открыться корректно, однако по окончании работы сохранение будет иметь неправильный вид.

    Важным моментом будет и то, что при сохранении в формате .xlsx OO может теряться часть данных. Неизвестно, с чем это связанно, но лучше будет после сохранения убедиться, что все нужные данные на месте.

    Microsoft Excel

    Сразу стоит отметить, что используя этот способ, для некоторых он может показаться более сложным и время затратным. Предыдущие программы проявляют себя в разы лучше, однако и этот метод имеет место быть. Обратите внимание, что Excel автоматически вносит некоторые правки в формат файла csv:

    • Округляет цифры – если в таблице есть цифровые значения, он может просто их округлить и испортить общую картину. Пример – 125334722,3537136 превратится в 125334722,35.
    • Удаляет плюсы – также, если указаны номера телефонов +7925…., знак плюс будет удален.
    • Разбивает цифры – та же ситуация с номерами телефона, он может разбить его по три цифры в формат – 79 261 236 643.
    • Удаляет нули – в случае если цифровое значение начинается на ноль, например, ИНН, то он будет удален. Пример – 002673228559, превратится в 2673228559.
    • Меняет даты – может доставить неудобства изменением дробей, к примеру, номер дома 3/7 изменит на 3 июля.

    Если знать все эти нюансы, можно комфортно работать и в этой программе. Рассмотрим детально, как это будет выглядеть:

      Импортируем данные в Excel. Выбираем пункт меню «Data», далее «Get External Data» и «From Text».

    Далее выбираете нужный csv-файл и попадаем в меню. «Тип файла» выбираем «Delimited». «Кодировка» – определяется автоматически, лучше проверить, чтобы совпадала с той, что в файле. Если в файле шапка идет первой строкой, выбираем «My Data Has Headers».

    Далее потребуется выбрать разделитель. Если это точка с запятой (Semicolon), то отключить «Treat consecutive delimiters as one». Далее важный момент, если выбран разделитель точка с запятой, пункт «Text qualifier» отмечаете «». Если разделителем служит запятая, отключать его не нужно, так как он предназначен для того, чтобы отличать обычные запятые внутри текста от разделителей.

    Последним шагом будет выбор формата полей. Для всех столбцов следует выбрать пункт «Text», после чего нажать «ОК» и все готово.

    Мы подробно рассмотрели наиболее ходовые способы, последний выглядит несколько сложнее, однако каждый выбирает, какой из них будет более удобным. Стоит отметить, что данная инструкция направлена на начинающих пользователей и профессионалы вряд ли смогут почерпнуть из нее для себя что-то новое.

    Как корректно открыть в Exel файл формата CSV

    О существовании и основных параметрах текстовых файлов значений с разделением запятыми знают, как правило, лишь те, кто работает с таблицами Excel. Для человека нового, не посвященного в особенности хранения и передачи табличных баз данных, даже простейшее открытие CSV-файлов может вызывать ряд проблем. Цель данной статьи — объяснить, как открыть файл CSV в Excel, и как бороться с неполадками в процессе их использования.

    1. Что такое CSV
    2. Варианты просмотра CSV-файла в Excel
    3. Простейший способ — из Проводника
    4. С разделением столбцов в Эксель
    5. Через вкладку «Файл»
    6. Работа в Excel сразу с несколькими файлами CSV
    7. Особенности открытия с Android-устройств
    8. Проблемы и их решения при открытии CSV
    9. Некорректное отображение CSV
    10. Исчезновение нулей в числовых данных
    11. Подмена числовых значений датой
    12. В заключение

    Что такое CSV

    CSV — формат документа, представляющего собой текстовый файл со списком значений, между которыми стоит разделитель. В англоязычном варианте он так и переводится: «Comma-Separated Values» — значения, разделенные запятой. Другими словами, это текстовое представление табличной информации XLS/XLSX- таблиц Excel.

    Например, в привычном «экселевском» документе позиции представлены в несколько столбцов: «товар|количество|цена». В файле расширения .csv эта информация отображена сплошным текстом через запятую: «товар, количество, цена».

    Проблема заключается в том, что этот формат не стандартизирован в полной мере, и из-за некорректных настроек текущего региона в Виндовс и кодировок пользователь может увидеть «тарабарщину» на экране вместо упорядоченной таблицы.

    Варианты просмотра CSV-файла в Excel

    От теории к практике — разбираемся, как открыть файл расширения CSV на примере ОС Windows 10.

    Для этого есть 3 способа:

    1. двойным кликом по документу из проводника;
    2. по вкладке «Файл» из запущенного Excel;
    3. по вкладке «Данные» в качестве вложения.

    Рассмотрим каждый из указанных выше вариантов.

    Простейший способ — из Проводника

    Как открыть в Экселе файл CSV посредством файлового менеджера:

    • Открываем «Проводник» или «Пуск/Документы».
    • Находим на диске требуемый элемент.
    • Кликаем по нему дважды левой кнопкой мыши.
    • Если документ открылся в блокноте, а не в Экселе, то жмем по нему правой кнопкой.
    • В подменю: «открыть с помощью/выбрать другое приложение».
    • Из списка программ выбираем Excel и ставим галочку «Всегда использовать это приложение».

    • Наш файл откроется в новом листе таблицы, но его содержимое может быть нечитаемым по причинам, описанным в начале статьи.

    С разделением столбцов в Эксель

    Данный способ более предпочтителен, так как позволяет выбрать кодировку символов, разделитель значений и прочие параметры для нормального вывода информации.

    Процесс выглядит так:

    • Запускаем MS Excel.
    • Переходим в «Данные», где нужно выбрать «Получение внешних данных/Из текста», и ищем требуемый CSV-файл в окне проводника.

    • Выделяем его, после чего кликаем «Импорт».

    • В «Мастере текстов» нужно задать три шага интерпретации данных документа. В первом шаге выбираем параметр «с разделителями», а формат файла, желательно, установить «Юникод (UTF-8)».

    Разделители нужны для правильного размещения значений в таблице, а формат задает кодировку символов (дабы не получить бред, именуемый в народе кракозябрами: «Oedieay yeaeode»).

    Второй шаг отвечает за выбор варианта разделителя. В России используется точка с запятой — выбираем ее.

    Последний шаг позволяет изменить формат данных столбцов таблицы. Это необязательная настройка, поэтому ее можно пропустить нажатием «Готово».

    Перед импортом данных пользователю дается выбор куда их помещать. Оставляем галочку «Имеющийся лист» и кликаем по «ОК».

    В результате получаем правильно сформированную таблицу в первоначальном виде.

    Через вкладку «Файл»

    Третий способ является чем-то средним между двумя первыми. Мы также пользуемся мастером текстов, но не вставляем данные в книгу, а открываем их отдельным файлом:

    Запускаем любой XLS/XLSX документ и выбираем вкладку «Файл» и жмем «Обзор».

    Кликаем по искомому CSV-элементу и подтверждаем кнопкой «Открыть».

    Следуем аналогично пункту 3 второго способа.

    Работа в Excel сразу с несколькими файлами CSV

    Начиная с MS Office 2013, в Excel разработчики добавили полезное расширение Power Query, позволяющее удобнее работать с текстовыми базами данных и объединять их в одной таблице.

    Чтобы объединить две CSV-таблицы в одной книге:

    • Открываем MS Excel 2013 (или новее);
    • Выбираем вкладку Данные/Создать запрос/Из файла/Из CSV и импортируем нужный документ;

    • В открывшемся окне предпросмотра жмем «Изменить», и если структура таблицы удовлетворительна, то нажимаем «Закрыть и загрузить/Загрузить в…/Только создать соединение»;

    Теперь делаем аналогичное действие со вторым CSV-документом, после чего в строке «Запросы книги» появится два пункта с нашими данными;

    Далее переходим «Создать запрос/Объединить запросы/Добавить» и в окошке отмечаем первичную и вторичную таблицу (первый и второй csv-файл);

    После подтверждения создается объединенная база значений. Для ее импорта на лист Excel нажимаем «Закрыть и загрузить».

    Особенности открытия с Android-устройств

    CSV-данные нечасто используются в мобильной среде, но, например, они полезны для переноса контактов с памяти одного устройства на другое.

    Так, скачав нужный файл, можно обновить книгу контактов Google. Кроме того, в Google-Play существуют бесплатные программы, вроде CSV Viewer или CSV File Viewer.

    Приложения позволяющие просматривать, изменять и загружать из сети текстовые БД на андроиде.

    Проблемы и их решения при открытии CSV

    Рассматриваемый тип документа не стандартизирован окончательно, что приводит к частым ошибкам при его чтении. Рассмотрим основные проблемы и способы их решения.

    Некорректное отображение CSV

    Если вместо упорядоченных строчек и столбцов все значения сбрасываются в одну область, то проблема кроется в разных региональных настройках системы и файла. В первую очередь нужно:

    Открыть «Пуск/Параметры»; (В windows 7 — Панельуправления)

    Зайти во «Время и язык/Регион/Дополнительные параметры/Региональные стандарты/ снова Доп. параметры»;

    «Разделитель целой и дробной части» должен быть запятой, а «Разделитель элементов списка» — точка с запятой.

    Помимо этого, не забываем указывать разделитель в Мастере текстов.

    Исчезновение нулей в числовых данных

    При открытии баз данных отдельным файлом из проводника случается утеря идущих вначале нулей в числовых значениях. Это происходит из-за округления чисел в Excel.

    Чтобы этого не случалось — откройте его вторым способом, описанным выше, но на 3 шаге не забудьте выделить проблемные столбцы и указать «Формат данных столбца» – текстовый.

    Подмена числовых значений датой

    Проблема аналогична предыдущей, только здесь числа могут интерпретироваться как даты. Решение проблемы то же — отмечайте неправильно интерпретированные столбцы в Мастере и меняйте формат на текстовый.

    В заключение

    Как видно из статьи, корректно открыть файл CSV в Excel — задача нетривиальная даже для опытного пользователя. Недостаток в виде плохой стандартизации делает его неудобным в использовании, нечитаемым в разных регионах с разными разделителями.

    Но благодаря полезным плагинам вроде Power Query и знаний об особенностях подобных баз данных можно облегчить себе работу и исключить пропажу информации в документе.

    Борис Аладышкин/ автор статьи

    Приветствую! Я являюсь руководителем данного проекта и занимаюсь его наполнением. Здесь я стараюсь собирать и публиковать максимально полный и интересный контент на темы связанные с современными технологиями и программным обеспечением. Уверен вы найдете для себя немало полезной информации. С уважением, Борис Аладышкин.

    Понравилась статья? Поделиться с друзьями:
    Itsovet61.ru
    Добавить комментарий

    ;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: