比较两个大型csv文件
创始人
2024-12-14 01:31:03
0
  1. 使用Pandas库逐行读取和比较两个csv文件中的数据,并输出不同的行。

示例代码:

import pandas as pd

读取第一个csv文件

df1 = pd.read_csv('file1.csv')

读取第二个csv文件

df2 = pd.read_csv('file2.csv')

将两个DataFrame进行比较,并输出不同的行

diff = df1.merge(df2, indicator=True, how='outer').query('_merge != "both"') print(diff)

  1. 如果两个csv文件的大小超过计算机的内存限制,可以使用Python中的文件迭代器进行比较。

示例代码:

import csv

打开第一个csv文件

with open('file1.csv', newline='') as f1: reader1 = csv.reader(f1)

打开第二个csv文件

with open('file2.csv', newline='') as f2: reader2 = csv.reader(f2) # 逐行比较两个文件 for row1, row2 in zip(reader1, reader2): if row1 != row2: print(f'difference at row {reader1.line_num} : {row1} != {row2}')

注意:以上示例代码仅适用于csv文件中每行数据的顺序和数目都相同的情况。如果两个文件中的数据顺序不同,或者其中一个文件中某些行不存在于另一个文件中,则需要进行更复杂的处理。

相关内容

热门资讯

五分钟透明!博乐温州棋牌有没有... 这是一款非常优秀的博乐温州棋牌有没有挂 ia辅助检测软件,能够让你了解到博乐温州棋牌有没有挂中牌率当...
六分钟辅助挂!博雅红河棋盘外挂... 1、六分钟辅助挂!博雅红河棋盘外挂,微扑克智能助手(详细透视辅助挂教程);详细教程。2、博雅红河棋盘...
6分钟黑科技!友友邳州麻将辅助... 6分钟黑科技!友友邳州麻将辅助器,微扑克靠谱(详细透视辅助软件教程);实战中需综合运用上述技巧,并根...
4分钟攻略!传送屋有外 挂,德... 4分钟攻略!传送屋有外 挂,德扑之星记分牌有有用(详细透视辅助挂教程);传送屋有外 挂黑科技是一款具...
5分钟了解!浙江游戏大厅辅具器... 5分钟了解!浙江游戏大厅辅具器,来玩app辅助工具(详细透视辅助器教程);(需添加指定薇757446...
7分钟介绍!广东雀神辅助器怎么... 7分钟介绍!广东雀神辅助器怎么买,微扑克职业代打(详细透视辅助助手教程);亲,其实确实真的有挂(需添...
三分钟攻略!可乐斗地主有没有挂... 三分钟攻略!可乐斗地主有没有挂,智星德州菠萝在哪下载(详细透视辅助神器教程);可乐斗地主有没有挂黑科...
九分钟规律!花花生活圈脚本,云... 九分钟规律!花花生活圈脚本,云扑克有辅助软件(详细透视辅助软件教程);(需添加指定薇75744690...
七分钟总结!中至窝龙必赢攻略,... 相信很多朋友都在电脑上玩过中至窝龙必赢攻略吧,但是很多朋友都在抱怨用电脑玩起来不方便。为此小编给大家...
1分钟详情!六瓣数字消有没有挂... 1分钟详情!六瓣数字消有没有挂,cloudpoker辅助器(详细透视辅助工具教程)关于六瓣数字消有没...