下面是一个示例代码,演示如何按日期和多个变量的唯一用户数量进行分组:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-02'],
'变量1': ['A', 'B', 'A', 'B', 'C'],
'变量2': ['X', 'X', 'Y', 'Y', 'Z'],
'用户': ['用户1', '用户2', '用户1', '用户3', '用户4']}
df = pd.DataFrame(data)
# 按日期和多个变量进行分组,并计算唯一用户数量
grouped = df.groupby(['日期', '变量1', '变量2']).agg({'用户': 'nunique'})
print(grouped)
输出结果如下:
用户
日期 变量1 变量2
2021-01-01 A X 1
B X 1
2021-01-02 A Y 1
B Y 1
C Z 1
在上面的示例代码中,我们使用groupby方法对日期、变量1和变量2进行分组,并使用agg函数计算唯一用户数量。最后,我们打印出分组后的结果。