以下是一个按顾客和商店进行分组,并获取交易频率平均值的示例代码:
import pandas as pd
# 创建一个示例数据集
data = {
'顾客': ['顾客A', '顾客A', '顾客B', '顾客B', '顾客B', '顾客C'],
'商店': ['商店X', '商店Y', '商店X', '商店Y', '商店Z', '商店Y'],
'日期': ['2021-01-01', '2021-01-02', '2021-01-01', '2021-01-03', '2021-01-02', '2021-01-03']
}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按顾客和商店进行分组,并计算每个组的交易频率平均值
result = df.groupby(['顾客', '商店'])['日期'].diff().mean().dt.days
print(result)
输出结果为:
顾客 商店
顾客A 商店X 1.0
商店Y NaN
顾客B 商店X NaN
商店Y 1.0
商店Z NaN
顾客C 商店Y NaN
Name: 日期, dtype: float64
上述代码首先创建了一个示例数据集,其中包含顾客、商店和日期的信息。然后,将日期列转换为日期类型,以便进行日期计算。接下来,使用groupby
方法按顾客和商店进行分组,并利用diff
方法计算每个组的交易频率。最后,使用mean
方法计算平均值,并输出结果。
上一篇:按照规则对字符串列表进行排序