假设我们有一个包含日期时间的数据集:
import pandas as pd
data = {'timestamp': ['2020-01-01 14:23:12', '2020-02-02 09:12:55', '2020-02-15 11:34:29', '2020-03-21 18:09:07', '2020-04-05 08:45:33', '2020-05-19 13:21:15']}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
我们可以使用pd.Grouper
将日期时间按月份进行分组,然后使用.count()
计算每个月的数据计数。代码如下:
df.groupby(pd.Grouper(key='timestamp', freq='M')).count()
其中key
参数指定了要进行分组的列名,freq
参数指定了分组的时间单位,这里是按月份进行分组。运行结果为:
timestamp
timestamp
2020-01-31 1
2020-02-29 2
2020-03-31 1
2020-04-30 1
2020-05-31 1
这样我们就成功地将日期时间按照月份分组并且计算了每个月的数据计数。
下一篇:按照日期时间字段分组月份