以下是一个示例代码,演示如何按月份和年份汇总计算分类变量的数量:
import pandas as pd
# 创建示例数据
data = {'Date': ['2022-01-01', '2022-01-02', '2022-02-01', '2022-02-03', '2023-01-01'],
'Category': ['A', 'B', 'A', 'B', 'A']}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['Date'] = pd.to_datetime(df['Date'])
# 添加年份和月份列
df['Year'] = df['Date'].dt.year
df['Month'] = df['Date'].dt.month
# 按年份和月份分组计算分类变量的数量
result = df.groupby(['Year', 'Month', 'Category']).size().reset_index(name='Count')
print(result)
这段代码首先创建了一个示例数据,其中包含日期和分类两列。然后,将日期列转换为日期时间类型,并添加了年份和月份列。最后,使用groupby
函数按年份、月份和分类变量分组,并计算每个组中的数量。结果将按照年份、月份和分类变量的顺序返回。
下一篇:按月份和年份汇总维度值