以下是一个示例代码,用于按月份和年份汇总维度值:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2022-01-01', '2022-02-01', '2022-03-01', '2022-01-15', '2022-02-15'],
'维度值': ['A', 'B', 'C', 'D', 'E']}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['日期'] = pd.to_datetime(df['日期'])
# 添加年份和月份列
df['年份'] = df['日期'].dt.year
df['月份'] = df['日期'].dt.month
# 按年份和月份分组,并计数每个维度值的数量
summary = df.groupby(['年份', '月份', '维度值']).size().reset_index(name='数量')
print(summary)
运行上述代码,将得到以下输出:
年份 月份 维度值 数量
0 2022 1 A 1
1 2022 1 D 1
2 2022 2 B 1
3 2022 2 E 1
4 2022 3 C 1
这个示例代码首先创建了一个包含日期和维度值的示例数据集。然后,使用pd.to_datetime()
函数将日期列转换为日期时间类型。接下来,通过dt.year
和dt.month
属性从日期时间中提取年份和月份,然后将它们添加到数据框中。最后,使用groupby()
函数按年份、月份和维度值进行分组,并使用size()
函数计数每个组中的数量。使用reset_index()
函数将结果转换为数据框形式,并将计数列命名为“数量”。
下一篇:按月份和年份排序 R