以下是一个按照类别和日期进行分组的示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Category': ['A', 'A', 'B', 'B', 'A'],
'Date': ['2020-01-01', '2020-01-02', '2020-01-01', '2020-01-02', '2020-01-03'],
'Value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['Date'] = pd.to_datetime(df['Date'])
# 按照类别和日期进行分组
grouped = df.groupby(['Category', pd.Grouper(key='Date', freq='D')])
# 对每个分组进行操作,例如计算每个分组的平均值
result = grouped.mean()
print(result)
输出结果为:
Value
Category Date
A 2020-01-01 1
2020-01-02 2
2020-01-03 5
B 2020-01-01 3
2020-01-02 4
这段代码首先创建一个示例数据集,其中包含类别(Category)、日期(Date)和数值(Value)列。然后,将日期列转换为日期时间类型,以便后续按日期进行分组。接下来,使用groupby
函数按照类别和日期进行分组。在这个示例中,使用pd.Grouper
函数将日期列指定为分组键,并设置频率为天('D')。最后,可以对每个分组进行操作,例如计算每个分组的平均值。在这个示例中,使用mean
函数计算每个分组的平均值。最后,将结果打印出来。
上一篇:按照类别和名称对数组进行升序排序
下一篇:按照类别和时间间隔分组的条形图