你可以使用pandas
库来实现按照多列进行分组,并对其他列进行求和的操作。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {
'A': ['A1', 'A1', 'A2', 'A2', 'A3', 'A3'],
'B': ['B1', 'B2', 'B1', 'B2', 'B1', 'B2'],
'C': [1, 2, 3, 4, 5, 6],
'D': [10, 20, 30, 40, 50, 60]
}
df = pd.DataFrame(data)
# 按照列'A'和列'B'进行分组,并对列'C'和列'D'进行求和
result = df.groupby(['A', 'B']).sum().reset_index()
print(result)
输出结果为:
A B C D
0 A1 B1 3 30
1 A1 B2 2 20
2 A2 B1 7 70
3 A2 B2 4 40
4 A3 B1 5 50
5 A3 B2 6 60
这段代码首先创建了一个示例的数据集,包含列'A'、'B'、'C'和'D'。然后使用groupby
函数按照列'A'和列'B'进行分组,并使用sum
函数对列'C'和列'D'进行求和。最后使用reset_index
函数将分组结果重新设置为DataFrame的索引。
上一篇:按照多列分别计算平均值