以下是一个示例代码,它按照每小时的时间窗口分组,并计算各列的平均值。
import pandas as pd
# 创建示例数据
data = {
'时间': ['2022-01-01 10:12:00', '2022-01-01 10:30:00', '2022-01-01 11:05:00', '2022-01-01 11:25:00'],
'数值1': [10, 20, 30, 40],
'数值2': [5, 15, 25, 35]
}
df = pd.DataFrame(data)
# 将时间列转换为日期时间类型
df['时间'] = pd.to_datetime(df['时间'])
# 按小时分组,并计算各列的平均值
df_grouped = df.groupby(pd.Grouper(key='时间', freq='H')).mean()
# 打印结果
print(df_grouped)
输出结果如下:
数值1 数值2
时间
2022-01-01 10:00:00 15.0 10.0
2022-01-01 11:00:00 35.0 30.0
在上述示例中,我们首先将时间列转换为日期时间类型,然后使用groupby
和pd.Grouper
函数按小时进行分组。最后,我们使用mean
函数计算各列的平均值。
上一篇:按照每天重复获取交易金额
下一篇:按照每行80个字符进行分行