下面是一个示例代码,用于遍历多个CSV文件并合并特定列使用Pandas库:
import pandas as pd
import glob
# 获取所有CSV文件的文件路径
csv_files = glob.glob('path_to_csv_files/*.csv')
# 创建一个空的DataFrame来存储合并后的数据
merged_data = pd.DataFrame()
# 遍历所有CSV文件
for file in csv_files:
# 读取CSV文件
df = pd.read_csv(file)
# 选择要合并的特定列
selected_columns = df[['column1', 'column2']]
# 合并到已有的数据中
merged_data = pd.concat([merged_data, selected_columns])
# 重置索引
merged_data.reset_index(drop=True, inplace=True)
# 打印合并后的数据
print(merged_data)
请确保将path_to_csv_files
替换为包含CSV文件的实际路径,并将column1
和column2
替换为要合并的特定列的列名。此示例假设所有的CSV文件具有相同的列结构。