假设我们有两个数据帧 A 和 B,其中 A 中包含数据按月分组,B 中包含每日数据。我们想要将这两个数据帧合并,并将 A 中的滞后数据添加到 B 中。 示例代码如下:
import pandas as pd
# 创建月度数据帧 A
A = pd.DataFrame({
'month': ['2021-01-01', '2021-02-01', '2021-03-01'],
'value': [100, 200, 300]
})
# 创建日常数据帧 B
B = pd.DataFrame({
'date': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-02-01', '2021-02-02', '2021-02-03', '2021-03-01', '2021-03-02', '2021-03-03'],
'value': [10, 20, 30, 40, 50, 60, 70, 80, 90]
})
# 将 A 中的日期转换为月的第一天,并添加一个月
A['month'] = pd.to_datetime(A['month']).dt.to_period('M') + 1
# 在 B 中添加月份列,用于与 A 进行合并
B['month'] = pd.to_datetime(B['date']).dt.to_period('M')
# 合并 A 和 B
merged = pd.merge(B, A, on='month', how='left')
# 将每个月份的 value 值向下填充
merged['value_y'] = merged['value_y'].fillna(method='ffill')
# 用 value_y 中的滞后值填充 value_x
merged['value_x'] = merged.groupby('month')['value_x'].shift()
print(merged)
输出结果为:
date value_x month value_y
0 2021-01-01
上一篇:不同日期格式的转换。使用哪个类?
下一篇:不同日期数据操作的SQL