按行位置划分数据集并保存在不同的文件中
创始人
2024-08-22 06:30:07
0

以下是一个示例代码,用于按行位置划分数据集并保存在不同的文件中:

import os

def split_dataset(input_file, output_dir, num_files):
    with open(input_file, 'r') as file:
        lines = file.readlines()

    total_lines = len(lines)
    lines_per_file = total_lines // num_files

    # 创建输出文件夹
    os.makedirs(output_dir, exist_ok=True)

    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file if i < num_files - 1 else None
        
        output_file = os.path.join(output_dir, f'dataset_{i+1}.txt')
        with open(output_file, 'w') as file:
            file.writelines(lines[start:end])

    print(f"数据集已成功划分为 {num_files} 个文件,并保存在 {output_dir} 文件夹中。")

# 示例用法
input_file = 'data.txt'
output_dir = 'output'
num_files = 5

split_dataset(input_file, output_dir, num_files)

在上述示例代码中,我们首先打开输入文件,并将其读取到一个列表中。然后,我们计算每个输出文件应该包含的行数,并创建输出文件夹。

接下来,我们使用一个循环来迭代每个输出文件。在每次迭代中,我们计算起始行和结束行的索引,并将相应的行写入输出文件中。

最后,我们打印一条消息,表示数据集已成功划分为指定数量的文件,并保存在指定的输出文件夹中。

请注意,上述示例假设输入文件是一个文本文件,其中每行包含一个数据样本。如果你的数据集具有不同的格式,请根据需要进行修改。

相关内容

热门资讯

举措透视!wepoker游戏安... 举措透视!wepoker游戏安装教程,wepoker有辅助插件吗,第三方教程(有挂秘笈)-哔哩哔哩>...
发现透视"wepok... 发现透视"wepoker辅助工具好用吗"开挂(透视)辅助器(9分钟了解高科技教程)发现透视"wepo...
模块透视!hhpoker可以控... 【亲,hhpoker可以控制吗 这款游戏可以开挂的,确实是有挂的,很多玩家在这款hhpoker可以控...
实测透视"微扑克发牌... 实测透视"微扑克发牌机制详解"开挂(透视)辅助器(玩家亲测黑科技教程)实测透视"微扑克发牌机制详解"...
秘籍透视!wepoker可以透... >>您好:wepoker辅助器官方确实是有挂的,很多玩家在这款wepoker辅助器官方游戏中打牌都会...
正版透视"wepok... 正版透视"wepoker透视软件下载"开挂(透视)辅助软件(科技分享揭秘教程)正版透视"wepoke...
模块透视!pokemmo辅助官... wepoker模拟器哪个好用 无需打开直接搜索微信:136704302本司针对手游进行,选择我们的四...
曝光透视"微扑克辅助... 曝光透视"微扑克辅助期是干嘛的"开挂(透视)辅助工具(记者发布总结教程)曝光透视"微扑克辅助期是干嘛...
大纲透视!约局吧辅助脚本,aa... aapoker安装包怎么使用是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用...
必看透视"微扑克辅助... 必看透视"微扑克辅助器官网入口"开挂(透视)辅助脚本(今日公布必赢教程)必看透视"微扑克辅助器官网入...