Как открыть excel в python
Перейти к содержимому

Как открыть excel в python

Pandas read_excel() — чтение файла Excel в Python

В Python данные из файла Excel считываются в объект DataFrame. Для этого используется функция read_excel() модуля pandas.

Лист Excel — это двухмерная таблица. Объект DataFrame также представляет собой двухмерную табличную структуру данных.

  • Пример использования Pandas read_excel()
  • Список заголовков столбцов листа Excel
  • Вывод данных столбца
  • Пример использования Pandas to Excel: read_excel()
  • Чтение файла Excel без строки заголовка
  • Лист Excel в Dict, CSV и JSON
  • Ресурсы

1. Пример использования Pandas read_excel()

Предположим, что у нас есть документ Excel, состоящий из двух листов: «Employees» и «Cars». Верхняя строка содержит заголовок таблицы.

Ниже приведен код, который считывает данные листа «Employees» и выводит их.

Первый параметр, который принимает функция read_excel ()— это имя файла Excel. Второй параметр (sheet_name) определяет лист для считывания данных.

При выводе содержимого объекта DataFrame мы получаем двухмерные таблицы, схожие по своей структуре со структурой документа Excel.

2. Список заголовков столбцов листа Excel

Чтобы получить список заголовков столбцов таблицы, используется свойство columns объекта Dataframe. Пример реализации:

3. Вывод данных столбца

Мы можем получить данные из столбца и преобразовать их в список значений. Пример:

4. Пример использования Pandas to Excel: read_excel()

Можно указать имена столбцов для чтения из файла Excel. Это потребуется, если нужно вывести данные из определенных столбцов таблицы.

5. Чтение файла Excel без строки заголовка

Если в листе Excel нет строки заголовка, нужно передать его значение как None.

Если вы передадите значение заголовка как целое число (например, 3), тогда третья строка станет им. При этом считывание данных начнется со следующей строки. Данные, расположенные перед строкой заголовка, будут отброшены.

6. Лист Excel в Dict, CSV и JSON

Объект DataFrame предоставляет различные методы для преобразования табличных данных в формат Dict , CSV или JSON.

Как работать с документами Excel, используя Python

Я считаю, что вы использовали Microsoft Excel в некоторых случаях. Он очень эффективен при работе с электронными таблицами, таблицами, диаграммами и т. Д. Но при чем тут Python?

Python меняет игру, когда дело доходит до файлов Excel, потому что он может автоматизировать сложные вещи, с которыми вы можете столкнуться при выполнении некоторых задач, связанных с Excel. Например, вам может потребоваться найти информацию в сотнях таблиц бюджетов компании. Очень сложно, не правда ли? В этом уроке я покажу вам, как легко использовать Python для работы с документами Excel.

О, не беспокойтесь, если на вашем компьютере не установлен Microsoft Excel. Вы можете использовать другие альтернативы, чтобы пройти этот учебник, такие как LibreOffice Calc и OpenOffice Calc .

OpenPyXL

OpenPyXL — это библиотека, используемая для чтения и записи файлов Excel 2010 xlsx/xlsm/xltx/xltm . Это библиотека, которую мы будем использовать в этом руководстве для работы с документами Excel.

Первое, что нам нужно сделать, чтобы использовать эту библиотеку, это установить OpenPyXL .

Установка OpenPyXL

Для установки OpenPyXL мы будем использовать pip , который (на основе Википедии):

Система управления пакетами, используемая для установки и управления программными пакетами, написанными на Python. Многие пакеты можно найти в индексе пакетов Python (PyPI) .

Вы можете выполнить шаги, указанные в Руководстве пользователя по Python Packaging, для установки pip , но если у вас Python 2.7.9 и выше или Python 3.4 и выше, у вас уже есть pip !

OpenPyXL теперь можно просто установить, введя следующую команду (в терминале Mac OS X):

pip install openpyxl

Открытие документа Excel

После установки OpenPyXL мы готовы начать работу с документами Excel. Первая обычная задача, которую мы выполняем для документа Excel, — это открыть этот документ. Загрузите файл Excel sample.xlsx , чтобы следовать руководству, или вы можете использовать любой файл Excel, который вам нравится.

Прежде чем мы сможем использовать OpenPyXL , нам нужно import его следующим образом:

Для открытия документа Excel нам нужен метод load_workbook() . Если вам интересно, что подразумевается под книгой, это просто документ электронной таблицы Excel. Сценарий, который нам нужен для открытия документа Excel, выглядит следующим образом:

Давайте теперь посмотрим type возвращаемый из load_workbook() . Это можно сделать следующим образом:

Это вернет следующее:

Как мы видим, возвращаемым объектом является Workbook , тип данных workbook . Объект Workbook здесь представляет файл Excel.

Название листа

Листы в Excel состоят из столбцов (буквы начинаются с A, B, C и т. Д.) И строк (начиная с 1, 2, 3 и т. Д.). Чтобы проверить, какие листы у нас есть в нашем документе Excel, мы используем метод get_sheet_names() следующим образом:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *