可以使用Python的pandas库来按照日期和小时分组创建时间序列。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'datetime': ['2021-01-01 01:12:34', '2021-01-01 02:34:56', '2021-01-02 10:22:33', '2021-01-02 11:11:11', '2021-01-03 08:45:23'],
'value': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 将datetime列转换为pandas的Datetime类型
df['datetime'] = pd.to_datetime(df['datetime'])
# 按照日期和小时分组创建时间序列
df['hour'] = df['datetime'].dt.hour
df['date'] = df['datetime'].dt.date
time_series = df.groupby(['date', 'hour']).sum()['value']
print(time_series)
运行上述代码将会输出按照日期和小时分组的时间序列:
date hour
2021-01-01 1 10
2 20
2021-01-02 10 30
11 40
2021-01-03 8 50
Name: value, dtype: int64
这里,我们首先将datetime
列转换为pandas的Datetime类型,然后使用dt.hour
和dt.date
属性从日期时间中提取小时和日期。接着,我们使用groupby
方法按照date
和hour
进行分组,并对value
列求和,得到按照日期和小时分组的时间序列。
下一篇:按照日期和月份过滤XML文件。