在Python中,可以使用pandas库来实现保留一个重复的行的操作。具体实现方法如下:
import pandas as pd
# 创建测试数据
df = pd.DataFrame({
'Name': ['Tom', 'Tom', 'Jerry', 'Jerry', 'Mickey'],
'Age': [20, 20, 25, 25, 22],
'Gender': ['M', 'M', 'M', 'M', 'M']
})
# 保留一个重复的行
df.drop_duplicates(keep='first', inplace=True)
# 输出结果
print(df)
以上代码中使用了Pandas库的drop_duplicates()函数来保留一个重复的行。
其中,keep参数指定了保留的方式,其取值可以为'first'、'last'或False,当值为'first'时,保留第一次出现的重复行,当值为'last'时,保留最后一次出现的重复行,当值为False时,则所有重复行都会被删除。
inplace参数表示是否在原数据上进行修改,若为True,则会在原数据上修改;若为False,则不会修改原数据,而是返回一个新的数据集。
执行以上代码后,保留了第一个'Tom'和第一个'Jerry'行的测试数据将被输出。
上一篇:保留一个值而不使其改变
下一篇:保留一个,删除重复的行。