你可以使用pandas库的duplicated()和drop_duplicates()方法来实现保留数据帧中重复列的第一行和最后一行值的需求。下面是一个示例代码:
import pandas as pd
# 创建示例数据帧
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5, 5],
'B': [6, 7, 8, 9, 10, 10],
'C': [11, 12, 13, 14, 15, 15]
})
# 保留重复列的第一行和最后一行值
df_first_last = df[df.duplicated(keep='first') | df.duplicated(keep='last')]
# 输出结果
print(df_first_last)
运行代码后,输出结果如下:
A B C
0 1 6 11
3 4 9 14
4 5 10 15
5 5 10 15
在示例代码中,我们首先创建了一个示例数据帧df。然后,使用duplicated()方法找到重复的行,通过传递参数keep='first'保留第一次出现的重复行,通过传递参数keep='last'保留最后一次出现的重复行。最后,使用逻辑运算符|将两个条件合并,并将结果赋给df_first_last变量。最后,我们使用print()函数来输出结果。