下面是一个示例代码,展示如何按照日期和部门进行排序和筛选:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-01', '2022-01-02', '2022-01-03'],
'部门': ['A', 'B', 'C', 'A', 'B', 'C'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按照日期和部门进行排序
df.sort_values(by=['日期', '部门'], inplace=True)
# 打印排序后的结果
print(df)
# 按照日期和部门进行筛选
filtered_df = df[(df['日期'] >= '2022-01-02') & (df['部门'] == 'B')]
# 打印筛选后的结果
print(filtered_df)
运行上述代码,会得到以下输出:
日期 部门 数值
0 2022-01-01 A 1
3 2022-01-01 A 4
1 2022-01-02 B 2
4 2022-01-02 B 5
2 2022-01-03 C 3
5 2022-01-03 C 6
日期 部门 数值
1 2022-01-02 B 2
4 2022-01-02 B 5
在示例代码中,首先创建了一个包含日期、部门和数值的示例数据集。然后,使用pd.to_datetime()
函数将日期列转换为日期类型,以便可以按照日期进行排序。接下来,使用sort_values()
函数按照日期和部门进行排序。最后,使用条件筛选语句df[(df['日期'] >= '2022-01-02') & (df['部门'] == 'B')]
进行按照日期和部门进行筛选。