以下是一个示例代码,用于按组进行每月数据查询:
import pandas as pd
# 创建示例数据
data = {
'日期': ['2020-01-01', '2020-01-02', '2020-02-01', '2020-02-02', '2020-03-01', '2020-03-02'],
'组别': ['A', 'B', 'A', 'B', 'A', 'B'],
'数值': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按组和月份进行分组
df_grouped = df.groupby(['组别', pd.Grouper(key='日期', freq='M')])
# 计算每个组每个月的数据总和
df_monthly_sum = df_grouped['数值'].sum()
# 打印结果
print(df_monthly_sum)
输出结果为:
组别 日期
A 2020-01-31 1
2020-02-29 3
2020-03-31 5
B 2020-01-31 2
2020-02-29 4
2020-03-31 6
Name: 数值, dtype: int64
这段代码首先创建了一个包含日期、组别和数值的示例数据。然后,将日期列转换为日期类型。接下来,使用groupby
函数按组和月份进行分组。然后,使用sum
函数计算每个组每个月的数据总和。最后,打印结果。
上一篇:按组进行的逻辑回归