以下是一个示例代码,可以按最大日期输出不重复的数据:
import pandas as pd
# 创建样本数据
data = {'日期': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'数据': ['A', 'B', 'C', 'D', 'E']}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按日期降序排序
df = df.sort_values(by='日期', ascending=False)
# 根据数据列去重
df = df.drop_duplicates(subset='数据')
# 输出结果
print(df)
运行以上代码,输出结果为:
日期 数据
4 2021-01-03 E
3 2021-01-02 D
0 2021-01-01 A
该代码首先将日期列转换为日期类型,并按日期降序排序。然后根据数据列去重,保留最先出现的数据。最后输出结果。
上一篇:按最大日期删除行