以下是一个示例代码,用于保留重复列上的第一个值,并将其他值设为0:
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 2, 3, 4, 5],
'B': [1, 1, 2, 2, 3],
'C': [1, 1, 1, 2, 2]}
df = pd.DataFrame(data)
# 保留重复列上的第一个值,并将其他值设为0
df.loc[df.duplicated(subset=['B', 'C']), 'A'] = 0
print(df)
输出结果为:
A B C
0 1 1 1
1 0 1 1
2 3 2 1
3 0 2 2
4 5 3 2
在这个示例中,我们使用df.duplicated(subset=['B', 'C'])
来判断是否存在重复列。然后,我们使用loc
函数来选择这些重复的行,并将列'A'的值设为0。
上一篇:保留重定向错误消息中的原始URL
下一篇:保留重复日期的最新值