Как отредактировать csv файл
Перейти к содержимому

Как отредактировать csv файл

Как редактировать CSV-файлы с помощью Microsoft Excel

Некоторые старые версии Microsoft Excel могут некорректно отображать CSV-файлы в кодировке UTF-8. В этом случае используйте функцию импорта данных из файлов. Порядок шагов описан на примере Microsoft Excel 2003.

  1. В главном меню Excel откройте вкладку «Данные».
  2. В секции «Получить внешние данные» выберите вариант «Из текста».
  3. В появившемся диалоговом окне в поле «Формат файла» выберите пункт «Юникод (UTF-8)» и завершите импорт данных из файла.

3 комментария

Дмитрий КДмитрий К 18 января 2022 18:45 #

При импорте файла и наличия в нем каких-либо ошибок формируется файл с перечнем ошибок ( в данном примере дублирующиеся строки). Ранее этот файл вроде как я помню был читабельным , а сейчас при открытии часть полей нечитабельна. Т.е. файл отчета стал формироваться с другой кодировкой? Версия Excell 2016 — устаревшая?

тут одно из двух наверное : либо что-то поменяли с формированием файла, либо Excell 2016 не умеет с ней работать?

Файл не могу приложить , но высылал его с запросом в поддержку — там дали ссылку на эту страницу.

alt=»Михаил Ушенин» />Михаил Ушенин Webasyst 19 января 2022 09:25 #

CSV формат файла: инструкция по работе с расширением

CSV формат

CSV (не путать с CVS) — это формат для представления прямоугольного массива (матрицы) числовых и текстовых значений. Это пример формата «плоского файла».

Общее описание формата csv

Это формат данных с разделителями, в котором поля и столбцы разделены символом запятой% x2C (Hex 2C), а записи / строки / строки разделены символами, обозначающими разрыв строки. RFC 4180 предусматривает использование пар CRLF для обозначения разрывов строк, где CR – это% x0D (Hex 0D), а LF -% x0A (Hex 0A). Каждая строка содержит одинаковое количество полей.

Поля, содержащие специальный символ (запятая, CR, LF или двойные кавычки), «экранированы», путем заключения в двойные кавычки (Hex 22). Необязательная строка заголовка отображается как первая строка документа в том же формате, что и обычные строки записи. Этот заголовок будет содержать имена, соответствующие полям в документе, и должен содержать то же количество полей, что и записи в остальной части документа.

CSV использует US-ASCII в качестве набора символов, но разрешены другие наборы символов. Иногда файл CVS и CSV путают.

Важная информация о редактировании файлов csv

  • Вся система выходит из строя, если в строке стоит пропущенная или лишняя запятая. Каждое значение после этого отсутствующего или лишнего поля данных будет введено в неправильный столбец. В худшем случае база данных может быть повреждена настолько серьезно, что потребуется вернуться к версии резервной копии, что приведет к потере самых последних изменений данных и проблем для администратора, поэтому важно поддерживать файловую структуру.
  • Столбцы в вашем CSV-файле могут появляться в любом порядке, если эта последовательность сохраняется. Другими словами, порядок, в котором заголовки столбцов появляются в первой строке, должен повторяться в последующих строках данных, чтобы данные в каждом поле можно было сопоставить с правильным столбцом.
  • У вас есть возможность опустить любые столбцы, в которых не хотите добавлять или редактировать данные, если только этот столбец не требуется для инструмента загрузки данных, базы данных или правил конфигурации сайта. На самом деле рекомендуется опускать ненужные столбцы, чтобы упростить структуру файла данных и снизить вероятность появления ошибок в ненужном столбце. Нельзя пропустить поля, необходимые для инструмента «Загрузить данные», но можно опустить поля, необходимые для базы данных, при условии, что значение по умолчанию подходит для всех записей, которые вы добавляете или редактируете. Если значение по умолчанию не подходит ни для одной из записей в вашем файле данных, необходимо включить этот столбец и указать соответствующие значения для этих записей.
  • Поля назначения в базе данных хранят различные версии значений, представленных на веб-страницах. Например, пользовательская цель «Представитель компании» хранится в базе данных как «company_rep». Значения сопоставляются друг с другом и преобразуются по мере загрузки и выгрузки данных из базы данных. Возможно, будет проще использовать значение базы данных, которое можно увидеть, при загрузке файла данных CSV по ссылкам в верхней части файла данных для загрузки.

Как структурированы csv файлы

Шаблоны CSV или файлы данных можно загрузить по ссылкам в верхней части инструмента «Загрузить данные». Первая строка шаблона или файла данных содержит заголовки столбцов. Каждая последующая строка соответствует записи в базе данных. Когда загружается шаблон CSV, он содержит только заголовки столбцов. Поскольку шаблоны используются для добавления новых записей, новые строки будут добавляться для каждой записи.

Когда документ данных CSV загружается, первая строка содержит заголовок столбца, а последующие строки содержат записи данных, которые уже существуют в базе данных. Записи в этих строках можно редактировать или удалять.

В документе CSV каждая строка содержит упорядоченную последовательность заголовков столбцов или значений, разделенных запятыми. Запятые используются для сохранения файловой структуры. Каждая запятая в первой строке (которая содержит заголовки столбцов) разделяет заголовок столбца и место в упорядоченной последовательности столбцов.

Запятые в последующих строках также поддерживают последовательность упорядоченных столбцов, поэтому первое значение в каждой последующей строке представляет значение в первом столбце, второе значение в каждой последующей строке представляет значение во втором столбце и так далее. В отличие от стандартной пунктуации предложений, после запятой не ставится пробел.

Большинство значений заключено в двойные кавычки. Исключением является односимвольное значение, например 1 или 0 (ноль). Заключение значения в двойные кавычки позволяет использовать в поле сложные значения, например, содержащие запятые, без нарушения структуры документа. Например, поле, содержащее ряд элементов, например избранные цвета, может иметь такое значение:

“красный, зеленый и синий”

Вы не будете знать об этих цитатах при просмотре файла данных в приложении для работы с электронными таблицами, но они появляются, когда file просматривается в текстовом редакторе.

Как и чем открыть файл csv расширения

Формат CSV, или значения, разделенные запятыми, это общий формат для хранения и передачи контента, включая контакты, календарные встречи и статистические данные. Excel по умолчанию читает файлы CSV, но в большинстве случаев, когда открывается таблица CSV в Excel, видно только зашифрованные данные, которые невозможно прочитать.

В инструкции ниже показано, как легко правильно открывать файлы CSV в Excel и просматривать их без необходимости конвертации чего-либо.

  1. Откройте новый документ Excel и перейдите на вкладку Данные.
  2. Нажмите «Из текста».
  3. Перейдите к CSV-файлу, который хотите открыть, и нажмите «Импорт». Импортируйте CSV-файл в Excel.
  4. Во вновь открывшемся окне выберите «С разделителями». Затем нажмите «Далее».
  5. Установите флажок рядом с типом разделителя – в большинстве случаев это либо точка с запятой, либо запятая. Затем нажмите «Далее».
  6. Щелкните «Готово».

Программы для работы с CSV

Файл CSV можно открыть в любой программе, однако для большинства пользователей CSV формат лучше всего просматривать в программе для работы с электронными таблицами, например в Microsoft Excel, OpenOffice Calc или Google Docs.

Microsoft excel

Microsoft Excel — полезная программа для анализа данных и документации. Это программа для работы с электронными таблицами, которая содержит ряд столбцов и строк, где каждое пересечение столбца и строки является «ячейкой». Каждая ячейка содержит одну точку данных или одну часть информации. Организуя хранение данных таким образом, вы упростите поиск информации и получите возможность автоматически извлекать информацию из изменяющихся данных.

Открытие csv сразу с разделением столбцов в эксель

Если файл имеет расширение .csv, простой двойной щелчок по файлу должен автоматически анализировать и разделять его на основе запятых. Если это не ваш случай, значит каким-то образом изменен тип файла по умолчанию для .csv. Если вы откроете проводник Windows и перейдете к одному из CSV-файлов, вы должны увидеть в списке следующий тип: «Файл значений, разделенных запятыми в Microsoft Excel».

Вы можете либо щелкнуть файл правой кнопкой мыши и открыть его в Excel, либо перейти к файлу из Excel и открыть его напрямую.

После открытия использовуйте пункт меню «Данные → текст в столбцы» для преобразования. Выберите «по разделителю» в поле выбора и используйте запятую в качестве единственного разделителя убедитесь, что это единственный отмеченный пункт.

Ручной метод превращения таблицы эксель в CSV файл
  1. В электронной таблице Excel щелкните Файл.
  2. Щелкните Сохранить как.
  3. Нажмите кнопку «Обзор», чтобы выбрать место для сохранения файла.
  4. Выберите “CSV” в раскрывающемся меню “Тип файла”.
  5. Щелкните Сохранить.

Libreoffice calc

LibreOffice — это бесплатный полнофункциональный пакет офисных приложений. Его родным файловым форматом является Open Document Format (ODF), открытый стандартный формат, который принимается правительствами во всем мире в качестве необходимого формата файлов для публикации и приема документов. LibreOffice также может открывать и сохранять документы во многих других форматах, включая те, которые используются в нескольких версиях Microsoft Office, в том числе и CSV.

Openoffice calc

Apache OpenOffice — это офисный программный пакет с открытым исходным кодом для обработки текстов, электронных таблиц, презентаций, графики, баз данных и многого другого. Он доступен на многих языках и работает на всех распространенных компьютерах. Он хранит все ваши данные в международном формате открытого стандарта, а также может читать и записывать файлы из других распространенных пакетов офисного программного обеспечения. Его можно скачать и использовать совершенно бесплатно для любых целей.

Блокнот

Блокнот — это универсальный текстовый редактор, включенный во все версии Microsoft Windows, который позволяет создавать, открывать и читать файлы с открытым текстом. Если файл содержит специальное форматирование или не является файлом с открытым текстом, его нельзя прочитать в Блокноте.

Notepad++

Notepad ++ — это бесплатный текстовый редактор для Microsoft Windows, который предоставляет дополнительные функции, которых нет в стандартном текстовом редакторе Windows, Блокноте. Впервые он был выпущен 24 ноября 2003 года разработчиком Дэном Хо и все еще находится в активной разработке.

Notepad ++ специально разработан для редактирования исходного кода. «++» в названии — это ссылка на оператор в таких языках программирования, как C, C ++, Java и JavaScript.

Safari

Safari — это интернет-браузер, который был впервые представлен 30 июня 2003 года и поддерживается на операционных системах Apple MacOS X и IOS.

Microsoft outlook

Microsoft Outlook — это приложение для управления электронной почтой и задачами, которое доступно в большинстве версий Microsoft Office. Впервые он был выпущен с Exchange Server 5.5 как связанная программа, а затем интегрирован в качестве основного приложения с пакетом Microsoft Office 97 и последующими версиями.

Просмотр формата csv онлайн

Для того, чтобы открыть CSV формат на компьютере без установки сторонних программ, можно использовать онлайн-сервисы. Вот список самых распространенных из них:

  1. Excel Online
  2. Google Docs
  3. Online CSV Editor

Открываем расширение csv на android

Для того, чтобы открыть расширение CSV формата на смартфоне под управлением Android, необходимо найти в Play Market подходящую программу, поддерживающую этот формат. Вот список самых распространенных из них:

  1. dr.fone
  2. Cool master Android assistant
  3. Mobikin Assistant
  4. Documento Office
  5. CSV Viewer

Решение проблем с файлами csv

Проблема 1: Сталкиваюсь с ошибками преобразования набора символов.

Используйте программу uconv для устранения ошибок при преобразовании набора символов.

Iconv входит в состав большинства дистрибутивов ОС UNIX, а uconv – нет. iconv ограничен памятью. uconv намного лучше подходит для работы с большими файлами. Используйте app-get или другой менеджер пакетов UNIX, чтобы получить uconv, если его нет. Затем введите команду:

uconv –from-code ISO_8859-1 –to-code UTF8

Проблема 2: Что делают эти посторонние управляющие символы?

Иногда файл выглядит нормально, но не загружается. Он может содержать непечатаемые символы ASCII, которые обычно не используются в файлах CSV. Их бывает сложно отследить. Может возникнуть эта проблема, если вы получаете необычные сообщения об ошибках при попытке загрузить файл и не можете отследить причину ошибки.

Используйте эту команду Perl, чтобы удалить эти символы, пропустив через нее файл:

perl -pi.bak -e’s / [\ 000- \ 007 \ 013- \ 037 \ 177- \ 377] // g; ‘

Проблема 3: Не знаю, как обращаться со значениями NULL.

Сделайте осознанный выбор того, как хотите обрабатывать значения NULL. Обычно \ N используется для представления значений NULL в данных. А если есть пустые строки, используйте два последовательных разделителя (например, ,,), чтобы указать, что поле не содержит данных.

Обратите внимание, что у Postgres есть некоторые проблемы с импортом этих типов файлов, если они содержат значения NULL. Postgres не позволит указать значение NULL как пустую строку (,,). Обычно это хороший способ представления NULL, но он не будет правильно импортирован как NULL в Postgres.Необходимо использовать явный указатель NULL, например \ N, поэтому, если вас действительно волнуют значения NULL, вы должны использовать \ N.

С чего начать

CSV (от англ. Comma-Separated Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Строка таблицы соответствует строке текста, которая содержит одно или несколько полей, разделенных запятыми (wikipedia.org).

Другими словами, это текстовый файл, в котором содержится информация в виде отдельных строк, где каждая строка это отдельная запись (например об одном товаре). Разделителем ( delimiter ) значений колонок (разделитель полей CSV) является символ запятая (,) или точка с запятой (;).

Разделитель текста – значения, содержащие зарезервированные символы (двойная кавычка, запятая, точка с запятой, новая строка) обрамляются двойными кавычками (“). Если в значении встречаются кавычки — они представляются в файле в виде двух кавычек подряд.

Наименование полей CSV – первая строка файла обычно сдержит наименование CSV полей (колонок) для идентификации этих полей (колонок).

Пример CSV-файла

Исходный текст CSV-файла, где каждая строка это одна строка таблицы:

Представление в виде втаблицы если открыть в Apache OpenOffice Calc :

_ID_ _NAME_ _MODEL_ _PRICE_
28 “HTC Touch HD” “Product 1” 1750.0000
29 “Palm Treo Pro” “Product 2” 112.0000
30 “Canon EOS 5D” “Product 3” 113.0000

Что бы посмотреть содержимое CSV-файла его можно открыть в любом текстовом редакторе, например в Notepad++ (Как проверить формат CSV-файла) или в любом другом тестовом редакторе.

Как создать CSV-файл

Наиболее удобный и быстрый способ получить шаблон CSV-файла правильного формата – это сделать экспорт товаров через расширение CSV Price Pro import/export. Для этого в разделе Товары (eng. Products) перейдите на вкладку Экспорт (eng. Export). , выберите справа необходимые поля для экспорта и сделайте экспорт, в результате вы получите готовый для работы CSV-файл

Чем открывать и редактировать CSV-файл

Первое что нужно сделать, это скачать и установить офисный пакет Apache OpenOffice , в составе которого есть Apache OpenOffice Calc , приложение для электронных таблиц, позволяющее работать с файлами в формате CSV.

При открытии CSV-файла в приложении Apache OpenOffice Calc выберите параметры в соответствии с настройками как показано на скриншоте ниже:

  • Кодировка файла: Юникод (UTF-8)
  • Разделитель значений колонок (разделитель полей CSV): точка с запятой (;)
  • Разделитель текста и зарезервированных символов: двойная кавычка (“)
  • Поля в кавычках как текст – выбрать
  • Меню по правому клику мышки для определения типа колонки (всегда текстовое eng. Text )

Open CSV-file

Как правильно сохранить CSV-файл

Microsoft Excel умеет открывать CSV-файлы в кодировке Unicode (UTF-8) через импорт данных из файла… и пожалуй на этом можно остановиться!

Microsoft Excel не умеет сохранять CSV-файлы должным образом, при сохранении в Microsoft Excel, вы получите CSV-файл в зависимости от региональных настроек системы, обычно это разделитель табуляция или запятая и кодировка Windows-1251 (для России).

Для того что бы сохранить файл в формате CSV выберите Файл > Сохранить как .

Edit filter settings

В появившемся окне выбрать тип файла Текст CSV (.csv), установите “галочку” напротив появившегося внизу пункта Изменение настроек фильтра

Нажать кнопку Сохранить .

В открывшемся окне выберите вариант Использовать текущий формат

В открывшемся окне Экспорт в текстовый файл выберите:

  • Кодировка: Юникод (UTF-8)
  • Разделитель поля: точка с запятой (;)
  • Разделитель текста: двойная кавычка (“)
  • Текстовые значения в кавычках – выбрать

Нажать кнопку OK для сохранения.

Как проверить формат CSV-файла

CSV является простым и распространенным форматом для табличных данных, это простой текстовый файл, который cодержит текст без форматирования и имеет расширение CSV (.csv) вместо традиционного расширения TXT (.txt), такой файл может быть открыт любой программой для работы с текстом.

Вот неполный список приложений для открытия простых текстовых файлов .txt или .csv:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *