以下是一个示例解决方案,使用Python的pandas库来进行按组汇总多列数据。
首先,导入必要的库:
import pandas as pd
接下来,创建一个包含多列数据的DataFrame:
data = {'Group': ['A', 'A', 'B', 'B', 'A', 'B'],
'Column1': [1, 2, 3, 4, 5, 6],
'Column2': [7, 8, 9, 10, 11, 12]}
df = pd.DataFrame(data)
DataFrame的结构如下:
Group Column1 Column2
0 A 1 7
1 A 2 8
2 B 3 9
3 B 4 10
4 A 5 11
5 B 6 12
现在,我们可以使用groupby()
函数按照Group
列进行分组汇总。假设我们想要计算每个组的Column1
和Column2
的和:
grouped = df.groupby('Group').sum()
这将给出按组汇总的结果:
Column1 Column2
Group
A 8 26
B 13 31
如果我们想要计算每个组的Column1
的平均值和Column2
的最大值,可以使用agg()
函数:
grouped = df.groupby('Group').agg({'Column1': 'mean', 'Column2': 'max'})
这将给出按组汇总的结果:
Column1 Column2
Group
A 2.666667 11
B 4.333333 12
这只是一个示例,你可以根据自己的需求进行更复杂的操作,如计算其他统计指标、应用自定义函数等。