按行位置划分数据集并保存在不同的文件中
创始人
2024-08-22 06:30:07
0

以下是一个示例代码,用于按行位置划分数据集并保存在不同的文件中:

import os

def split_dataset(input_file, output_dir, num_files):
    with open(input_file, 'r') as file:
        lines = file.readlines()

    total_lines = len(lines)
    lines_per_file = total_lines // num_files

    # 创建输出文件夹
    os.makedirs(output_dir, exist_ok=True)

    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file if i < num_files - 1 else None
        
        output_file = os.path.join(output_dir, f'dataset_{i+1}.txt')
        with open(output_file, 'w') as file:
            file.writelines(lines[start:end])

    print(f"数据集已成功划分为 {num_files} 个文件,并保存在 {output_dir} 文件夹中。")

# 示例用法
input_file = 'data.txt'
output_dir = 'output'
num_files = 5

split_dataset(input_file, output_dir, num_files)

在上述示例代码中,我们首先打开输入文件,并将其读取到一个列表中。然后,我们计算每个输出文件应该包含的行数,并创建输出文件夹。

接下来,我们使用一个循环来迭代每个输出文件。在每次迭代中,我们计算起始行和结束行的索引,并将相应的行写入输出文件中。

最后,我们打印一条消息,表示数据集已成功划分为指定数量的文件,并保存在指定的输出文件夹中。

请注意,上述示例假设输入文件是一个文本文件,其中每行包含一个数据样本。如果你的数据集具有不同的格式,请根据需要进行修改。

相关内容

热门资讯

最新技巧!潮汕掌上娱透视怎么买... 最新技巧!潮汕掌上娱透视怎么买,科技新星游牛牛辅助,存在挂教程(通报有开挂辅助下载);无需打开直接搜...
分享个大家!中至赣牌圈手机辅助... 您好:中至赣牌圈手机辅助这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的...
避坑细节!约战辅助,九九山城辅... 避坑细节!约战辅助,九九山城辅助免费,必胜教程(发现有开挂辅助器)1、下载安装好九九山城辅助免费,进...
推荐一款!四川熊猫辅助软件免费... 推荐一款!四川熊猫辅助软件免费,新鸿狐辅助软件是真的吗,wepoke教程(推荐有开挂辅助下载);无需...
如何分辨真伪!方片十三张透视脚... 如何分辨真伪!方片十三张透视脚本,三哥玩辅助器免费下载,微扑克教程(了解有开挂辅助平台);无需打开直...
一分钟了解!钱塘十三水透视卦,... 一分钟了解!钱塘十三水透视卦,决战卡五星游戏辅助器,可靠技巧(推荐有开挂辅助平台);无需打开直接搜索...
玩家必备教程!心悦怎么开挂,微... 玩家必备教程!心悦怎么开挂,微信随意玩辅助器,透视教程(详细有开挂辅助器)1、下载安装好微信随意玩辅...
一分钟揭秘!湖南牵手胡子跑脚本... 一分钟揭秘!湖南牵手胡子跑脚本,微信小程序游戏辅助器,教你攻略(分析有开挂辅助脚本);无需打开直接搜...
记者发布!雀姬辅助脚本,拱趴游... 记者发布!雀姬辅助脚本,拱趴游戏诀窍,大神讲解(实测有开挂辅助插件);无需打开直接搜索加(薇:136...
玩家攻略!福建天天开心辅助器是... 玩家攻略!福建天天开心辅助器是真的码,微信小程序游戏破解微乐游戏,必备教程(原来有有开挂辅助挂);无...