以下是一个使用Python解决这个问题的示例代码:
import os
import pandas as pd
def load_files(root_dir, file_extension):
file_list = []
for folder_name, subfolders, filenames in os.walk(root_dir):
for filename in filenames:
if filename.endswith(file_extension):
file_path = os.path.join(folder_name, filename)
file_list.append(file_path)
df = pd.DataFrame()
for file_path in file_list:
data = pd.read_csv(file_path) # 根据具体文件类型选择适当的读取方式
df = pd.concat([df, data], ignore_index=True)
return df
# 使用示例
root_dir = "文件夹路径"
file_extension = ".csv" # 需要加载的文件扩展名,例如:.csv, .txt, .xlsx 等
df = load_files(root_dir, file_extension)
print(df.head()) # 打印数据框的前几行
在上面的代码中,load_files
函数接受两个参数:root_dir
是根文件夹的路径,file_extension
是需要加载的文件扩展名。它首先遍历根文件夹及其子文件夹中的所有文件,并将符合条件的文件路径存储在一个列表中。然后,它创建一个空的数据框,并遍历文件列表中的每个文件,将其加载到数据框中。最后,返回加载完成的数据框。
请注意,在代码中的注释中,有一个pd.read_csv
函数的示例。根据实际情况,你可能需要根据文件类型选择合适的读取方式,例如pd.read_excel
或pd.read_table
等。