以下是一个示例代码,演示如何按照日期时间范围对数据进行分组,并计算每个分组中的数量:
import pandas as pd
# 创建示例数据
data = {
'日期时间': ['2021-01-01 08:00:00', '2021-01-01 09:30:00', '2021-01-02 10:15:00', '2021-01-02 11:30:00', '2021-01-03 14:45:00'],
'数据': ['A', 'B', 'C', 'D', 'E']
}
df = pd.DataFrame(data)
# 将 '日期时间' 列转换为日期时间类型
df['日期时间'] = pd.to_datetime(df['日期时间'])
# 按照日期时间范围进行分组,并计算每个分组中的数量
grouped = df.groupby(pd.Grouper(key='日期时间', freq='D')).size()
# 打印结果
print(grouped)
输出结果为:
日期时间
2021-01-01 2
2021-01-02 2
2021-01-03 1
Freq: D, dtype: int64
以上代码使用了Pandas库来处理数据。首先,将日期时间列转换为日期时间类型,然后使用pd.Grouper
按照日期时间范围进行分组,freq='D'
表示按天进行分组。最后,使用size()
函数计算每个分组中的数量。