以下是一个示例代码,演示如何保留多个数据框中的重复行:
import pandas as pd
# 创建示例数据框
df1 = pd.DataFrame({'A': [1, 2, 3, 4],
'B': ['a', 'b', 'c', 'd']})
df2 = pd.DataFrame({'A': [3, 4, 5, 6],
'B': ['c', 'd', 'e', 'f']})
# 使用concat()函数将两个数据框合并
df_combined = pd.concat([df1, df2])
# 使用duplicated()函数找到重复行
duplicates = df_combined[df_combined.duplicated()]
# 根据重复行创建筛选器
filter = df_combined.duplicated(keep=False)
# 根据筛选器获取所有重复行
result = df_combined[filter]
# 打印结果
print(result)
以上代码将创建两个示例数据框df1
和df2
,然后使用concat()
函数将它们合并成一个df_combined
数据框。接下来,使用duplicated()
函数找到所有重复行,并使用keep=False
参数保留所有重复行。最后,根据结果创建一个筛选器,并使用筛选器获取所有重复行。最后,结果将被打印出来。
请注意,如果您的数据框中包含多个列,请根据需要修改代码中的列名。