以下是一个遍历文件夹中的Excel工作簿并仅保留一个工作表的示例代码:
import os
import glob
import pandas as pd
def keep_one_sheet(file_path):
# 读取Excel文件
excel_file = pd.ExcelFile(file_path)
# 获取文件名和文件夹路径
folder_path, file_name = os.path.split(file_path)
# 创建新的Excel文件
new_file_path = os.path.join(folder_path, "new_" + file_name)
writer = pd.ExcelWriter(new_file_path)
# 遍历每个工作表并写入新文件
for sheet_name in excel_file.sheet_names:
# 仅保留第一个工作表
if sheet_name == excel_file.sheet_names[0]:
df = excel_file.parse(sheet_name)
df.to_excel(writer, sheet_name=sheet_name, index=False)
writer.save()
writer.close()
# 遍历文件夹中的Excel文件
folder_path = "文件夹的路径"
file_list = glob.glob(os.path.join(folder_path, "*.xlsx"))
for file_path in file_list:
keep_one_sheet(file_path)
请将文件夹的路径
替换为实际的文件夹路径,该代码将遍历指定文件夹中的所有Excel文件,并在同一文件夹下创建一个新的Excel文件,只保留每个工作簿的第一个工作表。