按行位置划分数据集并保存在不同的文件中
创始人
2024-08-22 06:30:07
0

以下是一个示例代码,用于按行位置划分数据集并保存在不同的文件中:

import os

def split_dataset(input_file, output_dir, num_files):
    with open(input_file, 'r') as file:
        lines = file.readlines()

    total_lines = len(lines)
    lines_per_file = total_lines // num_files

    # 创建输出文件夹
    os.makedirs(output_dir, exist_ok=True)

    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file if i < num_files - 1 else None
        
        output_file = os.path.join(output_dir, f'dataset_{i+1}.txt')
        with open(output_file, 'w') as file:
            file.writelines(lines[start:end])

    print(f"数据集已成功划分为 {num_files} 个文件,并保存在 {output_dir} 文件夹中。")

# 示例用法
input_file = 'data.txt'
output_dir = 'output'
num_files = 5

split_dataset(input_file, output_dir, num_files)

在上述示例代码中,我们首先打开输入文件,并将其读取到一个列表中。然后,我们计算每个输出文件应该包含的行数,并创建输出文件夹。

接下来,我们使用一个循环来迭代每个输出文件。在每次迭代中,我们计算起始行和结束行的索引,并将相应的行写入输出文件中。

最后,我们打印一条消息,表示数据集已成功划分为指定数量的文件,并保存在指定的输出文件夹中。

请注意,上述示例假设输入文件是一个文本文件,其中每行包含一个数据样本。如果你的数据集具有不同的格式,请根据需要进行修改。

相关内容

热门资讯

科普攻略!德普之星辅助器app... 科普攻略!德普之星辅助器app,we poker辅助器,德州论坛(有挂软件)是一款可以让一直输的玩家...
重大科普!佛手在线大菠萝智能辅... 重大科普!佛手在线大菠萝智能辅助器,wepoker作弊辅助,分享教程(有挂软件);原来确实真的有挂(...
一分钟教会你!wepoker怎... 一分钟教会你!wepoker怎么增加运气,epoker透视,切实教程(有挂透视)1、点击下载安装,微...
六分钟了解!hhpoker有辅... 六分钟了解!hhpoker有辅助吗,wepoker国外版透视,扑克教程(有挂技巧)科技教程也叫必备教...
我来教大家!wepoker辅助... 我来教大家!wepoker辅助透视,wepoker免费脚本弱密码,详细教程(有挂透明);wepoke...
记者发布!wpk辅助,德普之星... 记者发布!wpk辅助,德普之星透视辅助软件激活码,解密教程(有挂辅助);亲真的是有正版授权,小编(透...
揭秘攻略!aapoker万能辅... 《揭秘攻略!aapoker万能辅助器,hhpoker真的假的,揭秘教程(有挂教程)》 aapoker...
重大通报!sohoo poke... 自定义sohoo poker辅助器系统规律,只需要输入自己想要的开挂功能,一键便可以生成出微扑克专用...
三分钟了解!wpk辅助器,hh... 1、三分钟了解!wpk辅助器,hhpoker免费辅助器,必赢教程(有挂神器);详细教程。2、hhpo...
玩家必看攻略!wejoker私... 玩家必看攻略!wejoker私人辅助软件,智星德州可以透视吗,透明挂教程(有挂技巧)关于智星德州可以...