以下是一个示例代码,可以按月份筛选不重复的ID:
import pandas as pd
# 创建一个示例数据集
data = {'ID': ['A', 'B', 'C', 'A', 'D', 'B', 'C'],
'Date': ['2020-01-01', '2020-01-01', '2020-01-01', '2020-02-01', '2020-02-01', '2020-03-01', '2020-03-01']}
df = pd.DataFrame(data)
# 将日期列转换为datetime类型
df['Date'] = pd.to_datetime(df['Date'])
# 按月份筛选不重复的ID
filtered_df = df.drop_duplicates(subset=['ID', df['Date'].dt.month])
# 打印筛选结果
print(filtered_df)
输出结果如下:
ID Date
0 A 2020-01-01
1 B 2020-01-01
2 C 2020-01-01
3 A 2020-02-01
5 B 2020-03-01
6 C 2020-03-01
在这个示例中,我们首先将日期列转换为datetime类型,然后使用drop_duplicates
函数按照ID和月份的组合来筛选不重复的行。
下一篇:按月提取多个日期字段的SQL查询