在Python中,可以使用pandas
库来按组对多列进行多个函数的计算,并创建有信息的列名。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {
'Group': ['A', 'A', 'A', 'B', 'B', 'B'],
'Column1': [1, 2, 3, 4, 5, 6],
'Column2': [7, 8, 9, 10, 11, 12]
}
df = pd.DataFrame(data)
# 按组对多列进行多个函数的计算,并创建有信息的列名
grouped = df.groupby('Group').agg({
'Column1': [('Sum', 'sum'), ('Mean', 'mean')],
'Column2': [('Max', 'max'), ('Min', 'min')]
})
# 重命名列名
grouped.columns = ['{}_{}'.format(col[0], col[1]) for col in grouped.columns]
print(grouped)
输出结果:
Column1_Sum Column1_Mean Column2_Max Column2_Min
Group
A 6 2 9 7
B 15 5 12 10
在示例代码中,先创建了一个包含'Group'、'Column1'和'Column2'的数据帧df
。然后,使用groupby
函数将数据按照'Group'列分组。agg
函数用于对不同的列应用不同的聚合函数,并使用元组列表的方式提供了有信息的列名。最后,使用列表推导式对列名进行重命名,以便更好地表达每个列的含义。
下一篇:按组对多列求和