要按照不同列过滤数据框并通过列来汇总数据,可以使用Pandas库中的groupby函数。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 35, 40, 45],
'Salary': [5000, 6000, 7000, 8000, 9000, 10000]}
df = pd.DataFrame(data)
# 按照Name列进行分组,并计算每个分组的平均年龄和总薪资
grouped = df.groupby('Name').agg({'Age':'mean', 'Salary':'sum'})
print(grouped)
输出结果为:
Age Salary
Name
John 37 17000
Nick 32 15000
Tom 27 13000
在上述示例中,我们使用groupby函数按照Name列进行分组,并通过agg函数计算每个分组的平均年龄和总薪资。最后,我们打印出结果。