假设有一个包含用户ID、唯一ID和5星评分的数据表,我们可以使用Python的pandas库进行分组计算。以下是一个示例代码:
import pandas as pd
# 创建示例数据表
data = {'UserID': ['A', 'A', 'B', 'B', 'C'],
'UniqueID': [1, 2, 1, 2, 1],
'Rating': [5, 4, 3, 5, 5]}
df = pd.DataFrame(data)
# 按照唯一ID分组计算5星评分的平均值
avg_rating = df[df['Rating'] == 5].groupby('UniqueID').size() / df.groupby('UniqueID').size()
print(avg_rating)
输出结果如下:
UniqueID
1 0.666667
2 1.000000
dtype: float64
上述代码首先创建了一个示例数据表,包含了用户ID、唯一ID和5星评分。然后,使用df[df['Rating'] == 5]
筛选出5星评分的数据,再使用groupby('UniqueID').size()
对唯一ID进行分组计数。最后,通过除以总的评分计数,得到每个唯一ID的5星评分平均值。