你可以使用pandas库来按日期和城市重新采样和聚合数据框。下面是一个示例代码:
import pandas as pd
# 创建示例数据框
data = {'日期': ['2020-01-01', '2020-01-01', '2020-01-02', '2020-01-02', '2020-01-03'],
'城市': ['北京', '上海', '北京', '上海', '北京'],
'销售额': [1000, 2000, 1500, 1800, 1200]}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['日期'] = pd.to_datetime(df['日期'])
# 按日期和城市重新采样和聚合数据框
df_resampled = df.resample('D', on='日期').sum()
# 打印结果
print(df_resampled)
输出结果为:
销售额
日期
2020-01-01 3000
2020-01-02 3300
2020-01-03 1200
在这个示例中,我们首先创建了一个包含日期、城市和销售额的示例数据框。然后,我们使用pd.to_datetime()将日期列转换为日期时间类型,以便能够按日期进行重新采样。接下来,我们使用resample()函数将数据框按天进行重新采样,并使用sum()函数对销售额进行求和。最后,我们打印重新采样后的数据框。