
Excel в Python является популярной темой среди аналитиков данных и профессионалов, предлагая мощное сочетание двух наиболее важных инструментов для манипуляции и анализа данных. Гибкий язык программирования Python можно использовать для автоматизации повторяющихся задач Excel, манипуляции с сложными наборами данных и создания информативных визуализаций данных. Интегрируя Python с Excel, пользователи могут использовать преимущества обеих программ для повышения производительности, оптимизации рабочих процессов и получения более глубоких инсайтов из своих данных. В этой статье мы исследуем преимущества использования Excel в Python и как это может улучшить ваши возможности анализа данных.
Как Считать Файл Excel в Python
Python - отличный язык для работы с Excel. С помощью библиотеки Python Excel можно легко манипулировать файлами Excel, анализировать данные и автоматизировать задачи. Вот два примера использования Python с Excel:
Чтение и Запись Файлов Excel с Помощью pandas
Для чтения и записи файлов Excel с помощью Python можно использовать библиотеку pandas. Для установки используйте команду pip install "pandas[excel]". Вот фрагмент кода, который считывает файл Excel и сохраняет его как новый файл:
import pandas as pd
df = pd.read_excel('input_file.xlsx')
df['new_column'] = df['old_column'] * 2
df.to_excel('output_file.xlsx', index=False)
В этом примере мы используем функцию read_excel() для чтения входного файла, затем добавляем новую колонку и умножаем старую колонку на 2, и, наконец, сохраняем результат в новом выходном файле с помощью функции to_excel().
Манипулирование Файлами Excel с Помощью Openpyxl
Если вам нужен больший контроль над вашими файлами Excel, вы можете использовать библиотеку OpenPyXL. Для установки используйте pip install openpyxl. Вот пример того, как добавить новый лист в существующую книгу:
from openpyxl import load_workbook, Workbook
wb = load_workbook('existing_workbook.xlsx')
new_ws = wb.create_sheet('New Worksheet')
new_ws['A1'] = 'Hello, world!'
wb.save('existing_workbook.xlsx')
В этом примере мы загружаем существующую рабочую книгу с помощью load_workbook(), создаем новый рабочий лист с помощью create_sheet(), добавляем значение в ячейку A1 и, наконец, сохраняем изменения с помощью save().
Чтение и Запись Файлов Excel с Помощью xlrd
Xlrd - это библиотека для чтения данных и информации о форматировании из файлов Excel в историческом формате .xls. Вот пример кода для чтения файла Excel с использованием xlrd:
import xlrd
# specify path and filename of Excel file
file_path = 'path/to/file/excel_file.xls'
# open workbook
workbook = xlrd.open_workbook(file_path)
# get sheet by name
worksheet = workbook.sheet_by_name('Sheet1')
# read data from cells
cell_value = worksheet.cell_value(0, 0)
В приведенном выше примере библиотека xlrd используется для открытия файла Excel. Функция workbook.sheet_by_name используется для доступа к листу с именем 'Sheet1'. Функция worksheet.cell_value используется для чтения данных из ячеек листа. В примере читается значение ячейки A1.
Создание Нового Листа Excel в Python
Если вы хотите создать новый лист Excel в Python, вы можете использовать модуль openpyxl. Этот модуль позволяет создавать, читать и изменять файлы Excel.
Пример Кода 1: openpyxl
import openpyxl
# Create a new Excel workbook
workbook = openpyxl.Workbook()
# Activate the first sheet
sheet = workbook.active
# Rename the first sheet
sheet.title = "New Sheet"
# Save the workbook
workbook.save("new_excel_sheet.xlsx")
Пример Кода 2: xlwt
import xlwt
# Create a new workbook
workbook = xlwt.Workbook()
# Add a new sheet to the workbook
sheet = workbook.add_sheet("New Sheet")
# Save the workbook
workbook.save("new_excel_sheet.xls")
Оба этих примера создадут новый лист Excel с названием New Sheet и сохранят его в файл. Вы можете изменить код для создания листов с другими названиями или добавления данных в листы.
Открыть Excel в Python из Другой Директории
Чтобы открыть файл Excel из другой директории в Python, можно использовать модуль os Python и установить рабочую директорию в желаемую директорию. Затем используйте библиотеку pandas для чтения файла Excel.
import os
import pandas as pd
### set working directory to desired directory
os.chdir('/path/to/directory')
### read Excel file using pandas
df = pd.read_excel('excel_file.xlsx')
import pandas as pd
### read Excel file from a specific directory using pandas
df = pd.read_excel('/path/to/directory/excel_file.xlsx')
В обоих примерах функция pd.read_excel() используется для чтения файла Excel. Первый пример использует os.chdir(), чтобы изменить рабочий каталог на желаемый перед чтением файла. Второй пример сразу же читает файл Excel из определенного каталога.
Используя эти коды, можно легко открыть файл Excel из другого каталога в Python.
Пишите вместе с нами!
Вы можете внести свой вклад в статьи о Python на GitHub: создайте Fork, внесите правки и отправьте нам Pull request.