Язвы и грабли CSV и Excel: проблемы и решения. Сменить кодировку латиницы на кириллицу. Изменение кодировки в Microsoft Excel Как открыть csv в excel utf 8

CSV (Comma Separated Values) – распространённый формат для хранения табличных данных (числовых и текстовых) в виде простого текста. Этот формат файлов популярен и живуч благодаря тому, что огромное количество программ и приложений понимают CSV, хотя бы как альтернативный вариант файлового формата для импорта / экспорта. Более того, формат CSV позволяет пользователю заглянуть в файл и немедленно найти проблему с данными, если таковая имеется, изменить разделитель CSV, правила цитирования и так далее. Это возможно потому, что CSV – это простой текст, и даже не очень опытный пользователь, сможет легко его понять без специальной подготовки.

В этой статье мы изучим быстрые и эффективные способы экспорта данных из Excel в CSV и узнаем, как преобразовать файл Excel в CSV, сохранив без искажений все специальные и иностранные символы. Описанные в статье приёмы работают во всех версиях Excel 2013, 2010 и 2007.

Как преобразовать файл Excel в CSV

Если требуется экспортировать файл Excel в какое-либо другое приложение, например, в адресную книгу Outlook или в базу данных Access, предварительно преобразуйте лист Excel в файл CSV, а затем импортируйте файл .csv в другое приложение. Ниже дано пошаговое руководство, как экспортировать рабочую книгу Excel в формат CSV при помощи инструмента Excel – «Сохранить как ».

Замечание: Все упомянутые форматы сохраняют только активный лист Excel.


Экспортируем из Excel в CSV с кодировкой UTF-8 или UTF-16

Если на листе Excel содержатся какие-либо специальные или иностранные символы (тильда, ударение и подобные) или иероглифы, то преобразование листа Excel в CSV описанным выше способом не сработает.

Дело в том, что команда Сохранить как > CSV (Save as > CSV) исказит все символы, кроме ASCII (American Standard Code for Information Interchange). И если на листе Excel есть парные кавычки или длинные тире (перенесённые в Excel, например, из документа Word при копировании / вставке текста) – такие символы также будут искромсаны.

  • UTF-8 – это более компактная кодировка, использующая для каждого символа от 1 до 4 байт. Чаще всего рекомендуется использовать этот формат, когда символы ASCII преобладают в файле, т.к. большинство таких символов требует 1 байт памяти. Ещё одно преимущество в том, что кодировка файла UTF-8, содержащего только символы ASCII, ничем не будет отличаться от такого же ASCII-файла.
  • UTF-16 использует от 2 до 4 байт для хранения каждого символа. Учтите, что не во всех случаях файл UTF-16 требует больше места в памяти, чем файл UTF-8. Например, японские символы занимают от 3 до 4 байт в UTF-8 и от 2 до 4 байт в UTF-16. Таким образом, есть смысл использовать UTF-16, если данные содержат азиатские символы, в том числе Японские, Китайские и Корейские. Существенный недостаток этой кодировки в том, что она не полностью совместима с ASCII-файлами и требуются специальные программы для отображения таких файлов. Помните об этом, если планируете импортировать получившиеся файлы из Excel куда-то ещё.

Как преобразовать файл Excel в CSV UTF-8

Предположим, у нас есть лист Excel с иностранными символами, в нашем примере – это японские имена.

Чтобы экспортировать этот лист Excel в файл CSV, сохранив при этом все иероглифы, сделаем следующее:


Замечание: Не все простые текстовые редакторы полностью поддерживают символы Юникод, поэтому некоторые из них могут отображаться как прямоугольники. В большинстве случаев, это никак не повлияет на итоговый файл, и можно просто не обращать на это внимание или выбрать более продвинутый редактор, например, Notepad++.

  1. Так как в нашем текстовом Юникод файле в качестве разделителей используется символ табуляции, а мы хотим преобразовать его в CSV (разделители – запятые), то необходимо заменить символы табуляции на запятые.

Замечание: Если нет строгой необходимости получить файл именно с разделителями – запятыми, а нужен любой файл CSV, который Excel сможет понять, то этот шаг можно пропустить, так как Microsoft Excel отлично понимает файлы с разделителем – табуляцией.

Замечание: Если Ваш файл предназначен для использования за пределами Excel и формат UTF-8 является обязательным требованием, то не совершайте на листе никаких изменений и не сохраняйте его снова в Excel, поскольку это может привести к проблемам с чтением кодировки. Если какая-то часть данных не отображается в Excel, откройте тот же файл в Блокноте и в нём внесите исправления в данные. Не забудьте снова сохранить файл в формате UTF-8.

Как преобразовать файл Excel в CSV UTF-16

Экспортировать в файл CSV UTF-16 намного быстрее и проще, чем в UTF-8. Дело в том, что Excel автоматически применяет формат UTF-16 при сохранении файла как Текст Юникод (Unicode Text).

Для этого сохраняем файл при помощи инструмента Сохранить как (Save as) в Excel и затем в Проводнике Windows изменяем расширение созданного файла на .csv . Готово!

Если нужен файл CSV с запятой или точкой с запятой в качестве разделителя, замените все символы табуляции на запятые или точки с запятой соответственно в Блокноте или в любом другом текстовом редакторе на свой выбор (ранее в этой статье есть подробная инструкция, как это делается).

Другие способы преобразования файлов Excel в CSV

Описанные выше способы экспорта данных из Excel в CSV (UTF-8 и UTF-16) универсальны, т.е. подойдут для работы с любыми специальными символами и в любой версии Excel от 2003 до 2013.

Существует множество других способов преобразования данных из формата Excel в CSV. В отличие от показанных выше решений, эти способы не будут давать в результате чистый UTF-8 файл (это не касается , который умеет экспортировать файлы Excel в несколько вариантов кодировки UTF). Но в большинстве случаев получившийся файл будет содержать правильный набор символов, который далее можно безболезненно преобразовать в формат UTF-8 при помощи любого текстового редактора.

Преобразуем файл Excel в CSV при помощи Таблиц Google

Как оказалось, можно очень просто преобразовать файл Excel в CSV при помощи Таблиц Google. При условии, что на Вашем компьютере уже установлен Google Drive , выполните следующие 5 простых шагов:

Совет: Если файл Excel относительно небольшой, то для экономии времени можно перенести из него данные в таблицу Google при помощи копирования / вставки.


В завершение откройте созданный CSV-файл в любом текстовом редакторе, чтобы убедиться, что все символы сохранены правильно. К сожалению, файлы CSV, созданные таким способом, не всегда правильно отображаются в Excel.

Сохраняем файл.xlsx как.xls и затем преобразуем в файл CSV

Для этого способа не требуется каких-либо дополнительных комментариев, так как из названия уже всё ясно.

Это решение я нашёл на одном из форумов, посвящённых Excel, уже не помню, на каком именно. Честно говоря, я никогда не использовал этот способ, но, по отзывам множества пользователей, некоторые специальные символы теряются, если сохранять непосредственно из .xlsx в .csv , но остаются, если сначала .xlsx сохранить как .xls , и затем как .csv , как мы .

Так или иначе, попробуйте сами такой способ создания файлов CSV из Excel, и если получится, то это будет хорошая экономия времени.

Сохраняем файл Excel как CSV при помощи OpenOffice

OpenOffice – это пакет приложений с открытым исходным кодом, включает в себя приложение для работы с таблицами, которое отлично справляется с задачей экспорта данных из формата Excel в CSV. На самом деле, это приложение предоставляет доступ к большему числу параметров при преобразовании таблиц в файлы CSV (кодировка, разделители и так далее), чем Excel и Google Sheets вместе взятые.

Просто открываем файл Excel в OpenOffice Calc, нажимаем Файл > Сохранить как (File > Save as) и выбираем тип файла Текст CSV (Text CSV).

На следующем шаге предлагается выбрать значения параметров Кодировка (Character sets) и Разделитель поля (Field delimiter). Разумеется, если мы хотим создать файл CSV UTF-8 с запятыми в качестве разделителей, то выбираем UTF-8 и вписываем запятую (,) в соответствующих полях. Параметр Разделитель текста (Text delimiter) обычно оставляют без изменения – кавычки (“). Далее нажимаем ОК .

Таким же образом для быстрого и безболезненного преобразования из Excel в CSV можно использовать ещё одно приложение – LibreOffice . Согласитесь, было бы здорово, если бы Microsoft Excel предоставил возможность так же настраивать параметры при создании файлов CSV.

В этой статье я рассказал об известных мне способах преобразования файлов Excel в CSV. Если Вам знакомы более эффективные методы экспорта из Excel в CSV, расскажите об этом в комментариях. Благодарю за внимание!

Файлы и документы, созданные на компьютере, всегда имеют свою кодировку. Часто случается так, что при обмене файлами или скачивании их из интернета кодировка, в которой они созданы, не читается нашим компьютером. Причины этому могут быть разные - как отсутствие необходимой кодировки в программе, которой мы хотим открыть файл, так и просто отсутствие некоторых компонентов программы (дополнительного пакета шрифтов, например).

Ниже рассмотрим, как поменять кодировку нечитаемого файла или документа в разных программах.

Изменение кодировки на странице браузера

Для Google Chrome

  1. Выбираем меню «Настройки» → «Инструменты».
  2. Строка «Кодировка» - наводим мышью, и появляется список возможных кодировок в браузере.
  3. Выбираем для русских сайтов «Windows 1251». Если не поможет, пробуем «Автоматически».

Для Opera

  1. Нажимаем «Opera» → «Настройки»
  2. Слева меню «Веб-сайты» → поле 2 «Отображение» → «Настроить шрифты»
  3. В поле «Кодировка» выбираем «Кириллица (Windows 1251)».

Для Firefox

  1. Firefox → Настройки → Содержимое.
  2. Напротив строки «Шрифт по умолчанию» нажимаем кнопку «Дополнительно».
  3. Внизу окна выбираем «Кодировка» &rarr «Кириллица (Windows 1251)».

Изменение кодировки в Word

Рассмотрим процедуру изменения кодировки на примере Word 2010

  1. Открываем документ.
  2. Вкладка «Файл» → «Параметры».
  3. Выбираем строку «Дополнительно». В разделе «Общие» напротив строки «Подтверждать преобразование формата файла при открытии» ставим галочку. Нажимаем ОК.
  4. Далее откроется окно «Преобразование файла». Выбираем «Кодированный текст», жмем ОК.
  5. Далее в открывшемся окне отмечаем «Другая» и выбираем из списка кодировку, которая отобразит необходимый текст. В окне «Образец» можно просмотреть, как отображается текст в той или иной кодировке, выбранной нами.

Если пройденная процедура не помогла отобразить документ, можно попробовать поменять шрифт. Иногда документ может отображаться в виде «квадратиков» или других знаков, если в программе нет соответствующего шрифта.

Изменение кодировки в Excel

Рассмотрим процедуру изменения кодировки для Excel 93-2004 и 2007:

  1. Открываем нечитаемый документ с помощью программы Notepad++.
  2. Выбираем меню Encoding (Кодировка) → Конвертировать в UTF-8.
  3. Символы не изменятся, изменится только кодировка внизу экрана. Далее выбираем набор символов. Если это русский язык: Encoding → Character sets → Cyrillic → Windows-1251.
  4. Нажимаем "Сохранить". Открываем файл в Excel. Если не читается текст, пробуем повторить шаги 3-4.

Изменение кодировки текста

  1. Открываем файл в стандартном текстовом процессоре Блокнот.
  2. Нажимаем «Сохранить как».
  3. В открывшемся окне сохранения выбираем место, куда хотим сохранить файл, тип документа - текстовый, а также ставим другой тип кодировки.
  4. Сохранить.
  5. Пробуем открыть документ.

Дополнительно читайте статью

ВКонтакте Facebook Одноклассники

С переходом ко все новым версиям Windows острота проблемы существования множества кодировок русского языка почти сошла на нет

Если в таблице вместо нужной информации вы увидели вопросы, иероглифы или другие непонятные знаки, это значит, вам надо разобраться, как поменять кодировку в Excel. Эта функция доступна в самом Microsoft Office. Но избавиться от проблемы можно и другими методами.

Иногда мы получаем непонятные иероглифы

Компьютер воспринимает любую информацию, как набор цифр. Поэтому у каждого печатного знака есть свой код. Он состоит из чисел и букв латинского алфавита. Символы и соответствующие им числа - это и есть кодировка.

У неё есть несколько стандартов. Например, Koi-8, Unicode, Windows-1251, ASCII. И если файл с текстом сохранён, скажем, в Кои-8, в Excel он будет неправильно отображаться в Юникоде. Так как в этих наборах одним и тем же символам приписаны разные коды.

Как поменять кодировку в программе?

Для работы с таблицей , в которой используется стандарт, не заданный по умолчанию в программе, надо изменить кодировку. Существует несколько способов.

При помощи Notepad

Если в Экселе не получается превратить «кракозябры» в нормальный текст, откройте файл в программе «Notepad++». Она распространяется бесплатно. Настройте там отображение символов, а потом продолжайте работать в Excel.

Откройте файл в программе «Notepad++»

  1. Создайте резервную копию документа . Или сохраните информацию из него в какой-нибудь другой таблице.
  2. Запустите Notepad.
  3. Перейдите в Файл - Открыть (File - Open) и укажите путь к таблице. В поле «Тип файла» поставьте «Все типы» («All types»). Или укажите конкретный формат. Таблицы имеют расширения.cvs, .xls, .xltm, xlam, .xlm. В Нотпаде текст отобразится без сетки. В нём ничего не надо редактировать.
  4. Справа внизу в строке состояния будет изображён стандарт, используемый сейчас.
  5. Откройте меню Кодировка (Encoding). Оно находится вверху окна.
  6. Нажмите «Преобразовать в UTF-8» («Convert to UTF-8»). Документ будет конвертирован в нужный формат. Этот стандарт Excel воспринимает нормально и не станет превращать в бессвязный поток странных символов.
  7. Теперь выберите, какие знаки необходимо использовать. В том же меню Encoding наведите выпадающий список. Он там один.
  8. Для русского языка выберите Кириллица - Windows-1251. Если текст, скажем, на арабском или греческом - отметьте соответствующий набор символов. В разных странах используются разные стандарты.
  9. Программа попросит подтвердить действие.
  10. Если это не помогло, попробуйте другие кириллические шрифты.
  11. Сохранять текст надо тоже в экселевском формате.

Откройте файл в utf-8

Через интерфейс программы

Вот как сменить кодировку в Excel, используя встроенные возможности:

  1. Запустите программу . Не надо открывать заполненный документ. Нужен «чистый» лист.
  2. Перейдите во вкладку «Данные» в строке меню.
  3. На панели «Получать внешние данные» нажмите «Из текста».
  4. В списке «Тип файла» (он находится рядом с кнопкой «Отмена») выберите «Все» или «Любые». Так в окне будут отображаться форматы Excel, а не только.txt.
  5. Задайте путь к таблице.
  6. Откроется мастер импорта.
  7. В поле «Формат» можете выбрать желаемый стандарт.
  8. В области «Предварительный просмотр» показано, как будет выглядеть текст с отмеченным набором символов. Можете прокручивать список и искать, какая настройка подходит.
  9. Когда подберёте нужный вариант, нажмите «Готово».

Можно использовать встроенные возможности

Как сохранить файл в определённой кодировке?

Можно сделать так, чтобы в сохранённом вами файле стояла определённая кодировка Excel.

  1. Нажмите на зелёную кнопку «Файл» (в Office 2007 надо кликнуть на логотип слева вверху).
  2. Параметры - Дополнительно.
  3. Прокрутите вниз до раздела «Общие».
  4. Кнопка «Параметры веб-документа».
  5. Вкладка «Кодировка».
  6. В поле «Сохранить документ как» укажите желаемое значение и нажмите «OK».

Ещё можно сделать так:

  1. Нажмите на «Файл» или логотип офиса.
  2. Выберите «Сохранить как…».
  3. Кликните на «Сервис». Там будет тот же самый пункт «Параметры веб-документа».

Как добавить в программы офиса новую кодировку?

Если ни один из стандартов не подошёл для вашего документа , добавьте новые.

  1. Пуск - Панель управления.
  2. «Программы и компоненты» или «Удаление программ».
  3. Нажмите на пункт Office или Excel (в зависимости от того, установлен ли у вас весь пакет продуктов Микрософт Офис или только Эксель).
  4. Кнопка «Изменить». Она над основной рабочей областью.
  5. Поставьте маркер в «Добавить или удалить» и кликните «Продолжить».
  6. Откройте ветку Общие средства - Многоязыковая поддержка.
  7. Нажмите на чёрную стрелочку рядом с нужным стандартом и включите функцию «Запускать на моём компьютере».
  8. Кликните «Продолжить» и дождитесь окончания процесса. Будут добавлены новые наборы.

В Excel можно поменять кодировку, если символы отображаются неправильно. Эта функция доступна в инструментарии программы. Но иногда используется сторонний софт.

Почему появляются Каракули и иероглифы в Excel? У этой проблемы может быть несколько вариантов, соберу большинство решений в этой статье. Ну и заодно напишу, как добавлять и использовать символы-иероглифы в тексте.

Проблема с кодировкой часто возникает в разных программах. Кто уверен сталкивался с проблемой смены кодировки. Разберем и другие случаи

Если при открытии файла вы видите каракули/иероглифы в Excel, вам может помочь смена кодировки. Пересохраните файл следующим способом:

На вкладке Кодировка выберите Юникод (UTF-8) или Кириллица (Windows)

Пересохраняем файл.

Неверная кодировка при получении данных из внешних источников. Открытие CSV файлов

Если при вставке данных из других файлов или внешних источников получаются каракули/неизвестные символы, тоже рекомендуется уточнить кодировку. Сделать это можно следующим образом:

На ленте управления выберите вкладку Данные, а в разделе Получение внешних данных выберите нужный пункт.

Если вы вставляете обычные данные из файла, т.е. текст или таблицу, выберите Из текста

Укажите файл из которого забираем данные, после выберите формат данных, а главное в разделе Формат файла выберите Юникод (UTF-8).

Что выбрать с разделителем или фиксированной ширины (шаг 1), а так же следующий шаг (шаг 2) подробно описан в этой .

В шаге 3 выбираем «Общий» формат данных.

Открываем не той программой

Так же я рекомендую проверить, какой именно программой вы открываете Excel-файл. Бывает, что книги 2010 формата Excel открываются в Excel 2003 (или более ранние версии) с измененным на иероглифы текстом. Подробнее про форматы Excel .

Точно такая же проблема периодически возникает если открывать сложные Excel-книги с большим набором данных через альтернативные табличные редакторы, такие как LibreOffice.Calc, Apache OpenOffice и другие.

Как добавить символы-иероглифы в тексте?

«С текстом у меня все в порядке, мне нужно вставить иероглиф/символ в Excel» — скажите вы. Чтобы вставить символ перейдите на вкладку Вставка и в разделе Символы выберите Символ.

В таблице символов можно найти почти любой символ

Чтобы добавить его в текст — кликните по нему.

Поделитесь нашей статьей в ваших соцсетях:

CSV (Comma-Separated Values - значения, разделенные запятыми) - это текстовый формат, предназначенный для представления табличных данных. Например, он используется для экспорта данных, если их объемы достаточно велики. Однако при этом нередко возникает проблема: созданный csv-файл может не показывать символы русского алфавита или искажать их. Однако эта проблема легко решаема.

Суть проблемы состоит в следующем. Если версия Excel, в которой работает пользователь, не англоязычная, то она может ожидать другой кодировки CSV-файла, создаваемого для экспорта данных. А именно: кодировки того языка, к которому относится используемая версия Excel. При этом те символы, которые не входят в стандартный набор ASCII, могут искажаться.

Проблема решается следующим несложным путем:

1. Запустите Excel.
2. Откройте страницу “Data → From text” (в локализованом Excel, элементы меню могут называться иначе).
3. Откройте свой CSV файл и в окне “Text Wizard” установите необходимый разделитель и кодировку (use “UTF-8”).

Инструкция по решению той же проблемы для русскоязычного Excel 2007

1. Создайте новый документ (книгу) в Excel

2. В меню «Данные / Получить внешние данные» выберите импортирование «Из текста». В окне выбора файла выберите ваш CSV файл. Excel автоматически запустит Мастер текстов (импорт).

3. В настройке «Формат файла» выберите “Юникод (UTF-8)”:

5. Затем нажмите кнопку “Готово”. При правильном выборе кодировки проблем с адекватным отображением кириллических символов быть не должно.

И еще кое-что важное и нужное...

Наш сайт оказался для вас полезным?