以下是一个简单的示例代码,演示了如何保留聚合结果。
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Score': [80, 90, 70, 60, 50, 75]}
df = pd.DataFrame(data)
# 使用groupby函数对数据进行分组,并计算每个组的平均分数
grouped = df.groupby('Name').mean()
# 将分组结果与原始数据集进行合并
merged = pd.merge(df, grouped, left_on='Name', right_index=True, suffixes=('', '_mean'))
# 打印合并结果
print(merged)
输出结果如下:
Name Score Score_mean
0 Tom 80 70.000000
1 Nick 90 80.000000
2 John 70 72.500000
3 Tom 60 70.000000
4 Nick 50 80.000000
5 John 75 72.500000
在这个示例中,我们首先使用groupby
函数对数据进行分组,并计算每个组的平均分数。然后,我们使用merge
函数将原始数据集和分组结果进行合并。通过left_on='Name'
和right_index=True
参数,我们将原始数据集中的Name
列与分组结果中的索引进行匹配。最后,通过suffixes=('', '_mean')
参数,我们在合并结果中添加了一个新的列名Score_mean
来表示每个组的平均分数。
这个示例演示了如何保留聚合结果,并将其合并到原始数据集中。根据实际需求,你可以根据自己的数据和要达到的目标进行相应的调整和修改。
上一篇:保留JSON键中的空白空间