以下是一个示例代码,将CSV文件按行拆分成多个文件:
import csv
def split_csv_file(input_file, output_prefix, chunk_size):
with open(input_file, 'r') as file:
reader = csv.reader(file)
header = next(reader) # 读取并保存CSV文件的头部
file_index = 1
row_count = 0
output_file = f"{output_prefix}_{file_index}.csv" # 输出文件的文件名
with open(output_file, 'w', newline='') as output:
writer = csv.writer(output)
writer.writerow(header) # 将头部写入输出文件
for row in reader:
writer.writerow(row) # 将行写入输出文件
row_count += 1
if row_count >= chunk_size:
file_index += 1
row_count = 0
output_file = f"{output_prefix}_{file_index}.csv"
output.close() # 关闭当前输出文件
output = open(output_file, 'w', newline='') # 打开新的输出文件
writer = csv.writer(output)
output.close()
# 示例用法
split_csv_file('input.csv', 'output', 1000)
这个示例代码使用Python的csv模块来读取和写入CSV文件。它首先读取输入文件的头部,并将其写入所有输出文件。然后,它逐行读取输入文件,并将每一行写入当前输出文件。当达到指定的行数(chunk_size)时,会关闭当前输出文件,打开一个新的输出文件,并继续写入剩余的行。
在示例用法中,input.csv是要拆分的输入文件,output是输出文件的前缀(例如,如果output为output,则生成的文件名将为output_1.csv,output_2.csv等),1000是每个输出文件的行数。
上一篇:按行操作距离R
下一篇:按行拆分Pandas数据框架