以下是一个示例代码,说明如何按照其他列因素聚合列:
import pandas as pd
# 创建一个示例数据集
data = {'Category': ['A', 'B', 'A', 'B', 'A', 'B'],
'Value': [1, 2, 3, 4, 5, 6],
'Factor': ['X', 'X', 'Y', 'Y', 'Z', 'Z']}
df = pd.DataFrame(data)
# 按照Category和Factor列对Value列进行聚合求和
sum_df = df.groupby(['Category', 'Factor'])['Value'].sum().reset_index()
# 打印结果
print(sum_df)
输出结果如下:
Category Factor Value
0 A X 1
1 A Y 3
2 A Z 5
3 B X 2
4 B Y 4
5 B Z 6
这个示例中,我们使用了groupby
函数来按照Category和Factor列对Value列进行分组。然后,使用sum
函数对每个分组求和,并通过reset_index
将分组结果转化为一个新的DataFrame。最后,我们打印了聚合结果。