以下是一个示例代码,用于遍历文件夹中的文件,将两个变量相除,并将结果与原始文件的名称一起存储在一个新的数据框中。
import os
import pandas as pd
# 定义一个空的数据框,用于存储结果
result_df = pd.DataFrame(columns=['文件名称', '结果'])
# 遍历文件夹中的所有文件
folder_path = '文件夹路径'
for file_name in os.listdir(folder_path):
# 如果文件是以.csv结尾的
if file_name.endswith('.csv'):
# 读取文件
file_path = os.path.join(folder_path, file_name)
df = pd.read_csv(file_path)
# 定义两个变量
var1 = df['变量1']
var2 = df['变量2']
# 计算结果
result = var1 / var2
# 将结果存储在数据框中
result_df = result_df.append({'文件名称': file_name, '结果': result}, ignore_index=True)
# 打印结果数据框
print(result_df)
在上述代码中,你需要将文件夹路径
替换为你要遍历的文件夹的实际路径。该代码使用os.listdir()
函数列出文件夹中的所有文件,并使用.endswith('.csv')
筛选出以.csv
结尾的文件。然后,代码使用pd.read_csv()
函数读取每个文件,并从数据框中提取两个变量。接下来,代码计算两个变量的相除结果,并使用result_df.append()
函数将结果存储在结果数据框中。最后,代码打印结果数据框。
请注意,上述代码假设要遍历的文件是以.csv
结尾的,并且变量的名称为变量1
和变量2
。如果你的文件类型或变量名称不同,请相应地进行修改。