按行位置划分数据集并保存在不同的文件中
创始人
2024-08-22 06:30:07
0

以下是一个示例代码,用于按行位置划分数据集并保存在不同的文件中:

import os

def split_dataset(input_file, output_dir, num_files):
    with open(input_file, 'r') as file:
        lines = file.readlines()

    total_lines = len(lines)
    lines_per_file = total_lines // num_files

    # 创建输出文件夹
    os.makedirs(output_dir, exist_ok=True)

    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file if i < num_files - 1 else None
        
        output_file = os.path.join(output_dir, f'dataset_{i+1}.txt')
        with open(output_file, 'w') as file:
            file.writelines(lines[start:end])

    print(f"数据集已成功划分为 {num_files} 个文件,并保存在 {output_dir} 文件夹中。")

# 示例用法
input_file = 'data.txt'
output_dir = 'output'
num_files = 5

split_dataset(input_file, output_dir, num_files)

在上述示例代码中,我们首先打开输入文件,并将其读取到一个列表中。然后,我们计算每个输出文件应该包含的行数,并创建输出文件夹。

接下来,我们使用一个循环来迭代每个输出文件。在每次迭代中,我们计算起始行和结束行的索引,并将相应的行写入输出文件中。

最后,我们打印一条消息,表示数据集已成功划分为指定数量的文件,并保存在指定的输出文件夹中。

请注意,上述示例假设输入文件是一个文本文件,其中每行包含一个数据样本。如果你的数据集具有不同的格式,请根据需要进行修改。

相关内容

热门资讯

黑科技脚本!来玩德州app服务... 黑科技脚本!来玩德州app服务器在哪里(wepoke智能ai)一向有挂(有挂细节)-哔哩哔哩1、用户...
黑科技线上!aapoker挂(... 黑科技线上!aapoker挂(德州ai辅助神器软件)总是是真的有挂(有挂讲解)-哔哩哔哩1、完成德州...
黑科技挂!wepoke辅助技巧... 黑科技挂!wepoke辅助技巧(wepoke有没有挂)一向真的是有挂(有挂猫腻)-哔哩哔哩;一、we...
黑科技科技!gg扑克实战(we... 黑科技科技!gg扑克实战(wepoke黑科技)最初是真的有挂(竟然有挂)-哔哩哔哩1、金币登录送、破...
黑科技系统!德州之星辅助软件(... 黑科技系统!德州之星辅助软件(wepoke黑科技)先前真的是有挂(有挂技术)-哔哩哔哩1、任何德州a...
黑科技线上!德扑之星辅助器(德... 黑科技线上!德扑之星辅助器(德州ai软件购买)切实是有挂(有挂存在)-哔哩哔哩1、不需要AI权限,帮...
黑科技app!aapokera... 黑科技app!aapokerai辅助(德扑ai机器人软件开发)原来真的是有挂(有挂技术)-哔哩哔哩;...
黑科技辅助挂!德扑ai智能(德... 1、黑科技辅助挂!德扑ai智能(德州辅助神器软件)原本真的是有挂(新版有挂)-哔哩哔哩;详细教程。2...
黑科技挂!微扑克有辅助挂(aa... 黑科技挂!微扑克有辅助挂(aapoker发牌机制)原生存在有挂(有挂方针)-哔哩哔哩1、玩家可以在a...
黑科技有挂!aa扑克外挂(微扑... 黑科技有挂!aa扑克外挂(微扑克透牌)从前有挂(有挂细节)-哔哩哔哩,亲,有的,ai轻松简单,又可以...