假设有一个索引为时间的数据集,我们可以按小时进行分组,并保留每个小时的观察。以下是一个示例代码:
import pandas as pd
# 创建示例数据集
data = pd.DataFrame({'time': ['2021-01-01 08:15:00', '2021-01-01 08:30:00', '2021-01-01 09:00:00', '2021-01-01 09:30:00', '2021-01-01 10:00:00'],
'observation': [10, 20, 15, 25, 30]})
data['time'] = pd.to_datetime(data['time']) # 将时间列转换为datetime类型
data.set_index('time', inplace=True) # 设置时间列为索引
# 按小时进行分组并保留每个小时的观察
hourly_grouped = data.groupby(data.index.hour).apply(lambda x: x)
print(hourly_grouped)
输出结果为:
observation
time
8 2021-01-01 08:15:00 10
2021-01-01 08:30:00 20
9 2021-01-01 09:00:00 15
2021-01-01 09:30:00 25
10 2021-01-01 10:00:00 30
在这个示例中,我们首先创建了一个包含时间和观察值的示例数据集。然后,我们将时间列转换为datetime类型,并将其设置为数据集的索引。接下来,我们使用groupby
函数根据索引的小时部分进行分组,并使用apply
函数保留每个小时的观察。最后,我们打印出分组后的结果。
下一篇:按照索引查找匹配括号的令牌