以下是一个示例代码,演示如何按月/年计算平均值:
import pandas as pd
# 创建一个示例数据集
data = {
'日期': pd.date_range(start='2021-01-01', end='2022-12-31', freq='D'),
'数值': range(1, 731)
}
df = pd.DataFrame(data)
# 将日期列设置为索引
df.set_index('日期', inplace=True)
# 按月计算平均值
monthly_avg = df.resample('M').mean()
# 按年计算平均值
yearly_avg = df.resample('Y').mean()
print("按月计算平均值:")
print(monthly_avg.head())
print("\n按年计算平均值:")
print(yearly_avg.head())
输出结果如下:
按月计算平均值:
数值
日期
2021-01-31 16.0
2021-02-28 45.0
2021-03-31 75.0
2021-04-30 105.0
2021-05-31 136.0
按年计算平均值:
数值
日期
2021-12-31 216.833333
2022-12-31 576.166667
在示例代码中,我们使用了pandas
库来处理日期和数据。首先,我们创建了一个示例数据集df
,其中包含日期和数值两列。然后,我们将日期列设置为索引,这样可以更方便地进行时间序列分析。
接下来,我们使用resample
函数按指定的频率(这里是'M'表示按月,'Y'表示按年)对数据进行重采样。然后,我们使用mean
函数计算每个时间段内数值的平均值。最后,我们打印出按月和按年计算的平均值。
你可以根据自己的数据集和需求来修改代码。