以下是一个示例代码,将CSV文件按行拆分成多个文件:
import csv
def split_csv_file(input_file, output_prefix, chunk_size):
with open(input_file, 'r') as file:
reader = csv.reader(file)
header = next(reader) # 读取并保存CSV文件的头部
file_index = 1
row_count = 0
output_file = f"{output_prefix}_{file_index}.csv" # 输出文件的文件名
with open(output_file, 'w', newline='') as output:
writer = csv.writer(output)
writer.writerow(header) # 将头部写入输出文件
for row in reader:
writer.writerow(row) # 将行写入输出文件
row_count += 1
if row_count >= chunk_size:
file_index += 1
row_count = 0
output_file = f"{output_prefix}_{file_index}.csv"
output.close() # 关闭当前输出文件
output = open(output_file, 'w', newline='') # 打开新的输出文件
writer = csv.writer(output)
output.close()
# 示例用法
split_csv_file('input.csv', 'output', 1000)
这个示例代码使用Python的csv
模块来读取和写入CSV文件。它首先读取输入文件的头部,并将其写入所有输出文件。然后,它逐行读取输入文件,并将每一行写入当前输出文件。当达到指定的行数(chunk_size
)时,会关闭当前输出文件,打开一个新的输出文件,并继续写入剩余的行。
在示例用法中,input.csv
是要拆分的输入文件,output
是输出文件的前缀(例如,如果output
为output
,则生成的文件名将为output_1.csv
,output_2.csv
等),1000
是每个输出文件的行数。
上一篇:按行操作距离R
下一篇:按行拆分Pandas数据框架