以下是一个示例代码,用于计算按周分组的记录数量的累积和:
import pandas as pd
# 创建一个示例数据集
data = {'date': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', '2021-01-05', '2021-01-06', '2021-01-07', '2021-01-08', '2021-01-09', '2021-01-10'],
'count': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['date'] = pd.to_datetime(df['date'])
# 按周分组并计算每周的记录数量
weekly_counts = df.groupby(pd.Grouper(key='date', freq='W'))['count'].sum()
# 计算累积和
cumulative_counts = weekly_counts.cumsum()
print(cumulative_counts)
输出结果示例:
date
2021-01-03 60
2021-01-10 385
Freq: W-SUN, Name: count, dtype: int64
该示例代码首先创建了一个包含日期和记录数量的示例数据集。然后,将日期列转换为日期类型。接下来,使用groupby
函数按周分组,并计算每周的记录数量。最后,使用cumsum
函数计算累积和。最终,输出了每周的累积记录数量。
下一篇:按周分组的SQL行