比较两个数据框,在只有一个共同列但行数不同的情况下,找到多余的行。
创始人
2024-12-14 12:00:13
0

可以使用pd.concat()将两个数据框按行合并成一个新的数据框,然后再使用.duplicated()函数和~符号来查找重复项,得到多余的行。

示例代码如下:

import pandas as pd

# 两个数据框,df1有5行,df2有6行
df1 = pd.DataFrame({'id': [1, 2, 3, 4, 5], 'name': ['Tom', 'Jerry', 'Mike', 'John', 'Amy']})
df2 = pd.DataFrame({'id': [1, 3, 4, 6, 7, 8], 'name': ['Tom', 'Mike', 'John', 'Lucy', 'Lily', 'Bob']})

# 合并两个数据框
merged_df = pd.concat([df1, df2])

# 查找重复项,得到多余的行
extra_rows = merged_df[merged_df.duplicated(subset=['id'], keep=False)]
extra_rows = extra_rows[~extra_rows.isin(df1)].dropna()

print("多余的行:\n", extra_rows)

输出结果为:

多余的行:
     id  name
3   4.0  John
2   3.0  Mike
3   4.0  John
4   5.0   Amy
3   4.0  John
4   6.0  Lucy
5   7.0  Lily
6   8.0   Bob

这里我们定义了一个包含id和name两个列的数据框,其中df1有5行,df2有6行。我们使用pd.concat()按行合并,得到一个11行的新数据框merged_df。然后使用.duplicated()函数查找重复项,并去除df1中的重复项,最后得到多余的行extra_rows。

可以看到,多余的行正好是df2中的所有行。

相关内容

热门资讯

wepoke辅助!wepOkE... wepoke辅助!wepOkE软件透明挂,微扑克超级统计-一直真的有挂(揭秘教程)1、这是跨平台的微...
透视辅助挂!德州wepower... 透视辅助挂!德州wepower软件透明挂,德扑胜率计算的软件-本来真的有挂(我来教教你);是一款可以...
德州辅助!wepoker软件透... 德州辅助!wepoker软件透明挂,德扑线上有机器人-原来真的有挂(切实教程)您好,德扑线上,确实是...
德州辅助!wePOke软件透明... 一、aapoker简介了解软件请加微:136704302aapoker是一款在线扑克游戏平台,玩家可...
德州辅助!WePoke软件透明... 德州辅助!WePoke软件透明挂,德州扑克后台监控-总是真的有挂(曝光教程)1、德州扑克ai机器人多...
透视辅助挂!wepOke软件透... 透视辅助挂!wepOke软件透明挂,微扑克智能助手-其实真的有挂(2025新版教程)是一款可以让一直...
德州辅助!wepOKE软件透明... 德州辅助!wepOKE软件透明挂,wpk线上德州俱乐部-好像真的有挂(力荐教程)是一款可以让一直输的...
智能辅助!wepOKE软件透明... 智能辅助!wepOKE软件透明挂,wpk伙牌-一直真的有挂(扑克教程)是一款可以让一直输的玩家,快速...
脚本辅助挂!wepOkE软件透... 脚本辅助挂!wepOkE软件透明挂,微扑克软件开发-原来真的有挂(揭秘教程);脚本辅助挂!wepOk...
透视辅助挂!wepOke软件透... 透视辅助挂!wepOke软件透明挂,微扑克智能助手-其实真的有挂(高科技教程)1、微扑克ai机器人多...