比较两个数据框并根据行查找重复项
创始人
2024-12-14 11:00:35
0

假设我们要比较的两个数据框为df1和df2,我们可以使用以下代码来查找在两个数据框中都出现过的重复行:

common_rows = df1[df1.isin(df2)].dropna()

其中,isin()方法可以查找df1中的元素是否在df2中出现过,返回一个布尔型数据框。然后我们再通过dropna()方法去掉NaN值,即为在两个数据框中都出现的行。

例如,我们有以下两个数据框:

import pandas as pd

df1 = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c']})
df2 = pd.DataFrame({'col1': [2, 3, 4], 'col2': ['b', 'c', 'd']})

使用上面的方法,可以得到df1和df2中都出现的行:

   col1 col2
1     2    b
2     3    c

另外,如果我们只需要查找其中一个数据框中的重复行,可以使用pandas提供的duplicated()方法,如下:

# 查找df1中的重复行
duplicate_rows = df1[df1.duplicated()]

# 查找df2中的重复行
duplicate_rows = df2[df2.duplicated()]

相关内容

热门资讯

自建房九分钟!wepoke保险... 自建房九分钟!wepoke保险云扑克确实真的有挂(其实真的有挂)-百度知乎1.云扑克确实真的有挂 a...
漏洞3分钟!德州扑克微扑克俱乐... 漏洞3分钟!德州扑克微扑克俱乐部德扑ai智能机器人(一贯真的有挂)-今日头条所有人都在同一条线上,像...
输赢两分钟!wpk线上代打wp... 您好,wpk数据工具这款游戏可以开挂的,确实是有挂的,需要了解加微【487309276】很多玩家在这...
挂6分钟!wopoker有外挂... 挂6分钟!wopoker有外挂智星德州菠萝偷偷看功能(果真真的有挂)-微博客户端;1、智星德州菠萝偷...
神器2分钟!wpk德州ai机器... 神器2分钟!wpk德州ai机器人gg扑克正规(原来真的有挂)-知乎;1、用户打开应用后不用登录就可以...
胜率九分钟!德扑之星有作弊wo... 胜率九分钟!德扑之星有作弊wopoker透明挂(原来真的有挂)-知乎1、下载好德扑之星有作弊辅助软件...
安卓版五分钟!微扑克机制技巧f... 安卓版五分钟!微扑克机制技巧fishpoker app辅助(好像真的有挂)-小红书1、下载好微扑克机...
辅助6分钟!微扑克软件开发定制... 辅助6分钟!微扑克软件开发定制app来玩德州app苹果下载(总是真的有挂)-小红书1、许多玩家不知道...
智能四分钟!pokerx智能软... 智能四分钟!pokerx智能软件wepower软件靠谱(原来真的有挂)-小红书暗藏猫腻,小编详细说明...
猫腻十分钟!微扑克真的有外挂的... 猫腻十分钟!微扑克真的有外挂的来玩德州有外挂(原来真的有挂)-哔哩哔哩1、进入游戏-大厅左侧-新手福...