以下是一个示例代码,演示如何按照一个列值进行两小时分组:
import pandas as pd
# 创建示例数据
data = {'日期': pd.date_range('2021-01-01 00:00:00', '2021-01-02 23:59:59', freq='30min'),
'数值': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48]}
df = pd.DataFrame(data)
# 将日期列设置为索引
df.set_index('日期', inplace=True)
# 按照两小时进行分组
groups = df.groupby(pd.Grouper(freq='2H'))
# 遍历分组并打印结果
for group_name, group_data in groups:
print(group_name)
print(group_data)
print('-----------------------')
这段代码首先创建了一个示例的DataFrame,包含日期和数值两列。然后将日期列设置为索引。接下来使用groupby()
函数按照两小时进行分组,pd.Grouper(freq='2H')
表示按照两小时的频率进行分组。最后使用一个循环遍历每个分组并打印结果。
运行这段代码将会按照两小时分组,并输出每个分组的结果。你可以根据实际需求修改示例数据和分组的频率。