Как посмотреть кодировку файла csv
Перейти к содержимому

Как посмотреть кодировку файла csv

  • автор:

Как определить, в какой кодировке заливать данные в csv (открытие через excel)

Данные с файла считываются нормально, как и должны быть. Как я понял проблема в кодировке. Как узнать в какой кодировке открывает эти данные excel? Пробовал напрямую перекодировать phrase (посредством str.encode(‘utf-8’)) — все равно заливает мусор. Может быть, я что-то не так делаю?

Отслеживать
49.3k 17 17 золотых знаков 57 57 серебряных знаков 101 101 бронзовый знак
задан 17 ноя 2016 в 19:09
347 1 1 золотой знак 5 5 серебряных знаков 14 14 бронзовых знаков

2 ответа 2

Сортировка: Сброс на вариант по умолчанию

"Data" -> "Get External Data" -> "Import Text File" 

Поэтому сохраняйте данные в любой кодировке по вашему выбору. utf-8 поддерживает произвольные Unicode символы, поэтому если у вас нет особых предпочтений, то можно её по умолчанию использовать.

Кодировка результата определяется с помощью encoding параметра для open() :

#!/usr/bin/env python3 import csv with open('pr.csv', 'w', encoding='utf-8', newline='') as file: writer = csv.DictWriter(file, fieldnames=["phrase", "num", "link"]) writer.writeheader() writer.writerows(parsing_data) 

Обратите внимание: writerows() , а не writerow() . Также следует newline=» использовать с файлами, передаваемыми в csv модуль (чтобы окончания строк не портились).

Отслеживать
ответ дан 18 ноя 2016 в 21:16
52.4k 11 11 золотых знаков 110 110 серебряных знаков 312 312 бронзовых знаков

Пробовал, но открывая файл в exel — выводит неправильную кодировку. Открывая файл в encoding=’cp1251′ все работает.

20 ноя 2016 в 22:41

@Тимур смысл ответа, что вы вы а не excel задаёте кодировку. То есть данные лежат на диске в какой-то конкретной кодировке (зависит кто эти данные писал—это может быть что угодно). Сам csv файл не содержит указания кодировки явного, поэтому вы должны по другим каналам узнать (спросите того кто пишет эти файлы). При загрузке файла в excel вы явно указываете эту кодировку. Если вы знаете, что файл сохранен в cp1251, тогда вы Excel и говорите, что файл сохранён именно в этой кодировке. Хотя если не указать, то на русской Винде он может эту кодировку по умолчанию использовать—точно не знаю.

Файл CSV открывается в Excel в неверной кодировке

Файл CSV открывается в Excel в неверной кодировке - Elbuz от ElbuzGroup дропшиппинг поставщики aliexpress amazon shopify лучшие приложения для начинающих продукты ebay дистрибьюторы wix как начать бизнес продавцы магазины alibaba сравнивает ваши цены заказы для поставщиков создать каталог

При выгрузке данных из Jumper, в файл, в формате CSV данные всегда сохраняются в кодировке UTF-8 (без BOM).
Microsoft Excel не умеет определять кодировку файла CSV и всегда открывает файл в кодировке ANSI (win-1251), поэтому после открытия текст не читабелен.

Как вариант решения, Вы можете переименовать расширение файла .csv в . txt, затем открыть его в Microsoft Excel, Вам будет предложено выбрать кодировку файла, выберите UTF-8.
Так же Вы можете файл в формате CSV открыть любым текстовым редактором, например в Notepad++, ведь CSV это обычный текстовый файл.

Сохрани ссылку на эту статью

Будь в курсе новостей

Никакого спама, только полезная информация о последних обновлениях и эксклюзивных материалах!

Укажите, пожалуйста, ваш адрес электронной почты
Спасибо что вы с нами!

Далее

Ошибка при выгрузке файла на FTP сервер (список кодов ответов FTP)

Ошибка при выгрузке файла на FTP сервер (список кодов ответов FTP)

При выгрузке файла на указанный сервер FTP в журнале указывается статус выгрузки, на основании эт.

Как выгружать на сайт реальное количество товара

Как выгружать на сайт реальное количество товара

Как выгрузить на сайт количество товара, которое указано в карточке товара? По умолчанию, програ.

Как правильно открыть CSV файл в Excel

CSV или Comma-Separated Values – это текстовый файл с табличными данными, в котором столбцы разделены специальным символом, чаще всего это запятая или точка с запятой. Формат CSV часто используется при экспорте данных с различных программ, устройств или онлайн сервисов. Для дальнейшей обработки данных из CSV обычно используется Excel или другой табличный процессор. В этом материале мы расскажем, как открыть CSV файл в Excel, а также как решить распространенные проблемы, которые могут при этом возникать.

Проверяем кодировку CSV файла

Для того чтобы успешно открыть CSV файл в Excel желательно предварительно проверить его кодировку, и, если это необходимо, выполнить преобразование в ANSI. Дело в том, что при открытии CSV файлов Excel по умолчанию использует кодировку ANSI. Поэтому, если ваш файл закодирован с использованием UTF-8 или какой-то другой кодировки, то при его открытии будут возникать проблемы с отображением кириллицы.

Если ваш CSV файл небольшого размера, то для проверки кодировки и преобразования можно использовать программу « Блокнот », которая идет в комплекте с Windows. Для этого откройте CSV файл в « Блокноте » и обратите внимание на нижний правый угол окна, там будет указана кодировка. Если в качестве кодировки используется «ANSI», то все нормально, можно переходить к открытию CSV файла в Excel. Если же используется другая кодировка (например, UTF-8), то файл нужно сначала преобразовать в ANSI.

кодировка в блокноте

воспользуйтесь меню « Файл – Сохранить как ». После этого в окне сохранения файла нужно указать кодировку « ANSI » и сохранить файл.

сохранение в кодировке ANSI

Если же CSV файл большой, то вы не сможете открыть его в обычном « Блокноте ». В этом случае придется установить текстовый редактор от стороннего разработчика. Например, вы можете проверить кодировку и выполнить преобразование при помощи AkelPad (скачать) или Notepad++ (скачать).

Открываем CSV файл в Excel

Если с кодировкой текста все нормально, то CSV файл можно открывать в Excel. Это можно сделать разными способами. Самый простой вариант, это просто кликнуть по CSV файлу правой кнопкой мышки и выбрать « Открыть с помощью – Excel ».

Открыть с помощью – Excel

Также вы можете сначала открыть Excel, а потом воспользоваться меню « Файл – Открыть ».

Файл – Открыть

В большинстве случаев, если у текста правильная кодировка, то это хорошо работает и Excel без проблем открывает CSV таким способом. При этом все данные правильно распределяются по соответствующим им ячейкам.

CSV в Excel

Но, в некоторых случаях подобный способ открытия CSV файлов может сработать не в полной мере. Например, текст загрузится в Excel, но данные не будут распределены по столбцам. Либо данные из CSV будут искажены стандартным форматом ячеек, который используется в таблице. Решение подобных проблем мы рассмотрим ниже.

Данные не распределились по столбцам

В некоторых случаях, после открытия CSV файла в Excel, автоматического распределения данных по столбцам не происходит. Чаще всего такая проблема возникает если в CSV используются какие-либо не стандартные разделители. Также подобная ситуация может возникать на старых версиях программы Excel.

Данные не распределились по столбцам

Для решения этой проблемы нужно выделить столбец с данными (обычно это первый столбец таблицы), перейти на вкладку « Данные » и нажать на кнопку « Текст по столбцам ».

кнопка Текст по столбцам

В результате появится « Мастер распределения текста по столбцам ». С его помощью можно вручную распределить данные из CSV по столбцам таблицы. На первом шаге просто выбираем вариант « С разделителями » и переходим далее.

вариант С разделителями

На следующем шаге указываем разделитель, который используется в CSV файле, и переходим далее. Если используется какой-либо специфический разделитель, то здесь нужно выбрать вариант « Другой » и указать его вручную.

выбор разделителя для CSV файла

Завершающий шаг – выбор формата ячеек. Здесь можно указать, какой формат ячеек должен использоваться для каждого из столбцов. Данная опция будет полезной, если у вас сложные данные, которые искажаются после импорта из CSV. Более подробно об этом в конце.

выбор формата ячеек

После настройки формата ячеек нажмите на кнопку « Готово » для того, чтобы завершить работу мастера.

данные распределились по столбцам

После завершения работы мастера все данные будут распределены по столбцам таблицы.

Excel искажает данные из CSV-файла

В некоторых случаях, при работе со сложными данными, Excel может искажать исходную информацию из CSV файла. Например, если в вашем CSV присутствуют большие числа, то они могут быть приведены к экспоненциальной форме, то есть число « 123123123123 » будет преобразовано в « 1,23123E+11 ». Также будут удалены лидирующие нули и значение « 000123123 » будет преобразовано в « 123123 ». Подобных преобразований в Excel огромное количество, поэтому после открытия CSV файла исходные данные могут быть изменены до не узнаваемости, при этом часть информации будет потеряна безвозвратно.

Чтобы избежать данной проблемы нужно следить, чтобы формат ячеек всегда соответствовал данным, которые в эти ячейки помещаются. Если ни один из стандартных форматов не подходит, то нужно использовать формат « Текстовый », в этом случае данные не будет изменяться вообще никак.

В старых версиях Excel для решения этой проблемы можно было использовать функцию « Получить данные из текстового/CSV-файла », которая доступна на вкладке « Данные ». После использования данной функции запускался « Мастер распределения текста по столбцам » в котором можно было задать формат ячеек для каждого из столбцов. Но, к сожалению, в последних версиях Excel это уже не работает.

Получить данные из текстового / CSV-файла

Сейчас эту проблему можно решить, если изменить расширение CSV-файла на TXT и после этого открыть данный TXT-файл в Excel с помощью меню « Файл – Открыть ». В этом случае открывается нужный мастер и позволяет нам правильно импортировать данные.

На первом шаге здесь нужно выбрать вариант « С разделителями » и указать кодировку текста.

вариант С разделителями

Дальше выбираем символ-разделитель, который отделяет данные в разных столбцах.

выбор разделителя

И выбираем подходящий формат ячеек для каждого из столбцов. Для того чтобы данные вообще не изменялись выбираем – « Текстовый ».

выбор формата ячеек

Для завершения работы с мастером нажмите на кнопку « Готово » и данные с CSV загрузятся в новый документ Excel.

  • Как построить график в Excel
  • Как закрепить область в Экселе
  • Чем открыть XLS
  • Чем открыть XLSX
  • Как вставить формулу в Word

Создатель сайта comp-security.net, автор более 2000 статей о ремонте компьютеров, работе с программами, настройке операционных систем.

Остались вопросы?

Задайте вопрос в комментариях под статьей или на странице «Задать вопрос» и вы обязательно получите ответ.

1 комментарий — Добавьте свой
Василий 28.09.2022

Просто замечательная программа Excel. А LbreOffice Calc открывает *.csv файлы просто и непринужденно, без всяких плясок с бубнами.

Сменить кодировку файла на UTF-8 в Excel

Если при импорте контактов вы видите нечитаемые символы, как на скриншоте, это значит, что кодировка файла не подходит для импорта в Unisender. Файл нужно перекодировать в UTF-8. Далее мы расскажем, как это сделать в Excel.

Ошибка отображения данных при неправильной кодировке файла.

Создаем и открываем новый Excel файл.

Создаем новый файл.

Переходим на вкладку «Данные», выбираем «Получение внешних данных», а далее — «Из текста».

получение данных из текста.

В окне для импорта текстового файла выбираем файл с неверной кодировкой и нажимаем кнопку «Импорт».

Импортируем файл с неправильной кодировкой.

Открывается мастер импорта текста.
С текущей кодировкой содержимое файла нечитабельное.

текущая кодировка.

В поле «Формат файла» перебираем кодировки, пока не найдём ту, в которой текст отображается правильно. Вариантов много, поэтому можно начать с форматов, которые начинаются со слова «Кириллица». Находим нужный формат, нажимаем «Далее».

Выбираем символы-разделители. В нашем случае это запятая.

Нажимаем «Далее» — «Готово» — «OK»

выбираем символы-разделители.

Так выглядит импортированный текст в Excel.

как выглядит документ в ексель.

Теперь нажимаем «Файл» — «Сохранить как».

Выбираем место, где будет храниться файл. Вводим название файла, тип файла выбираем CSV, ниже нажимаем «Сервис» — «Параметры веб-документа».

сохраняем файл.

Переходим на вкладку «Кодировка», выбираем «Юникод UTF-8» и нажимаем «OK».

выбираем кодировку.

Теперь импортируем его и видим, что текст отображается корректно.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *