以下是一个示例代码,展示如何按照日期和变量对数据框进行排序:
import pandas as pd
# 创建一个示例数据框
data = {'日期': ['2022-01-01', '2022-01-02', '2022-01-01', '2022-01-02'],
'变量1': [10, 20, 30, 40],
'变量2': [5, 10, 15, 20]}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['日期'] = pd.to_datetime(df['日期'])
# 按照日期和变量1进行排序
df_sorted = df.sort_values(by=['日期', '变量1'])
# 打印排序后的数据框
print(df_sorted)
输出结果如下:
日期 变量1 变量2
0 2022-01-01 10 5
2 2022-01-01 30 15
1 2022-01-02 20 10
3 2022-01-02 40 20
在示例代码中,首先创建了一个包含日期和变量的数据字典,并使用pd.DataFrame()
函数将其转换为数据框。然后,使用pd.to_datetime()
函数将日期列转换为日期时间类型,以便能够按照日期进行排序。
接下来,使用df.sort_values()
函数按照指定的列名进行排序,通过by=['日期', '变量1']
指定首先按照日期排序,然后按照变量1排序。
最后,使用print()
函数打印排序后的数据框。