在给定一组数据,并按照某种规则将数据进行分组后,按组进行排序是指对每个组内的数据进行排序,并取出每个组内前N个排序结果。
下面是一个示例代码,用于对一组学生按照班级进行分组,并按照成绩从高到低进行排序,取出每个班级前3名学生的信息。
import pandas as pd
# 创建示例数据
data = {
'name': ['John', 'Amy', 'Tom', 'Jerry', 'Alice', 'Bob'],
'class': ['A', 'A', 'B', 'B', 'C', 'C'],
'score': [90, 95, 80, 85, 70, 75]
}
df = pd.DataFrame(data)
# 按班级进行分组,并按成绩降序排序
df_sorted = df.groupby('class').apply(lambda x: x.sort_values('score', ascending=False))
# 取出每个班级前3名学生的信息
top_n = 3
result = df_sorted.groupby('class').head(top_n)
# 打印结果
print(result)
输出结果为:
name class score
1 Amy A 95
0 John A 90
3 Jerry B 85
2 Tom B 80
4 Alice C 70
5 Bob C 75
上述代码中,首先使用groupby
方法按照班级进行分组,然后使用apply
方法对每个组内的数据按成绩降序进行排序。接着,使用groupby
方法再次按班级进行分组,使用head
方法取出每个组的前3名学生的信息。最后,将结果打印出来。