在Pandas中使用groupby函数可以按照指定的列或者条件对数据进行分组。然后,可以通过agg函数来对分组后的数据进行聚合操作。下面是一个保持顺序的Pandas groupby的示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Tom'],
'Subject': ['Math', 'English', 'Math', 'English', 'Science'],
'Score': [90, 85, 95, 80, 70]}
df = pd.DataFrame(data)
# 按照Name列进行分组,并保持顺序
grouped = df.groupby('Name', sort=False)
# 对分组后的数据进行聚合操作,例如计算每个学生的平均分
result = grouped.agg({'Score': 'mean'})
# 输出结果
print(result)
运行上述代码,输出的结果为:
Score
Name
Tom 80.0
Nick 85.0
John 95.0
在上述代码中,首先创建了一个示例数据集df,然后使用groupby函数按照Name列进行分组,并设置sort=False保持顺序。接下来,使用agg函数对分组后的数据进行聚合操作,例如计算每个学生的平均分。最后,输出聚合结果。
上一篇:保持顺序的numpy数组的独特行
下一篇:保持顺序的情况下从列表中选择数据