要解决这个问题,可以使用Python的csv模块来读取和分割CSV文件。下面是一个示例代码:
import csv
def split_csv(filename, delimiter=','):
with open(filename, 'r') as file:
reader = csv.reader(file, delimiter=delimiter)
header = next(reader) # 读取表头
line_count = 0
file_count = 1
output_file = None
for row in reader:
if line_count == 0 or line_count % 1000 == 0:
if output_file:
output_file.close() # 关闭上一个输出文件
output_filename = f'output_{file_count}.csv'
output_file = open(output_filename, 'w', newline='')
writer = csv.writer(output_file, delimiter=delimiter)
writer.writerow(header) # 写入表头
file_count += 1
writer.writerow(row)
line_count += 1
if output_file:
output_file.close() # 关闭最后一个输出文件
print(f'Successfully split the CSV file into {file_count-1} parts.')
split_csv('input.csv')
上述代码会将名为input.csv
的输入文件分割成多个输出文件,每个文件最多包含1000行(除了最后一个文件)。输出文件的命名规则为output_1.csv
,output_2.csv
等。
请注意,代码中使用了csv.reader
和csv.writer
来读取和写入CSV文件,其中的delimiter
参数指定了字段之间的分隔符(默认为逗号)。
此外,代码还使用了计数器line_count
和file_count
来跟踪读取的行数和输出文件的编号。当读取的行数达到1000的倍数时,就会关闭当前输出文件并打开下一个输出文件。
最后,代码会打印出成功分割CSV文件的消息,并显示分割后的文件数。
请根据实际情况调整代码中的参数和逻辑,以满足您的需求。