假设有一个包含“用户ID”和“点赞”、“评论”、“分享”等交互类型的数据集,需要按照用户ID对其进行分组。
首先引入必要的库:
import pandas as pd
创建一个包含交互数据的数据集:
data = {'user_id': [1, 2, 3, 1, 2, 2],
'action': ['like', 'comment', 'share', 'like', 'comment', 'like']}
df = pd.DataFrame(data)
print(df)
输出结果为:
user_id action
0 1 like
1 2 comment
2 3 share
3 1 like
4 2 comment
5 2 like
然后根据用户ID和交互类型进行分组:
grouped = df.groupby(['user_id', 'action']).size().reset_index(name='count')
print(grouped)
输出结果为:
user_id action count
0 1 like 2
1 2 comment 2
2 2 like 1
3 3 share 1
其中,“size()”函数用于计算每个分组内的元素个数,“reset_index()”函数用于将计算结果重新命名为“count”并转换为数据框的形式。
通过以上方法,我们就可以按照用户ID和他们的交互类型对数据集进行分组并计算每组的数量。