按行位置划分数据集并保存在不同的文件中
创始人
2024-08-22 06:30:07
0

以下是一个示例代码,用于按行位置划分数据集并保存在不同的文件中:

import os

def split_dataset(input_file, output_dir, num_files):
    with open(input_file, 'r') as file:
        lines = file.readlines()

    total_lines = len(lines)
    lines_per_file = total_lines // num_files

    # 创建输出文件夹
    os.makedirs(output_dir, exist_ok=True)

    for i in range(num_files):
        start = i * lines_per_file
        end = start + lines_per_file if i < num_files - 1 else None
        
        output_file = os.path.join(output_dir, f'dataset_{i+1}.txt')
        with open(output_file, 'w') as file:
            file.writelines(lines[start:end])

    print(f"数据集已成功划分为 {num_files} 个文件,并保存在 {output_dir} 文件夹中。")

# 示例用法
input_file = 'data.txt'
output_dir = 'output'
num_files = 5

split_dataset(input_file, output_dir, num_files)

在上述示例代码中,我们首先打开输入文件,并将其读取到一个列表中。然后,我们计算每个输出文件应该包含的行数,并创建输出文件夹。

接下来,我们使用一个循环来迭代每个输出文件。在每次迭代中,我们计算起始行和结束行的索引,并将相应的行写入输出文件中。

最后,我们打印一条消息,表示数据集已成功划分为指定数量的文件,并保存在指定的输出文件夹中。

请注意,上述示例假设输入文件是一个文本文件,其中每行包含一个数据样本。如果你的数据集具有不同的格式,请根据需要进行修改。

相关内容

热门资讯

透视新版(德州ai人工智能)德... 透视新版(德州ai人工智能)德扑之星可以抽水吗(详细辅助安装教程)从来存在有挂德州ai人工智能辅助器...
aapoker有外挂!智星德州... aapoker有外挂!智星德州菠萝辅助,(aapoKer)素来是真的有挂(详细辅助插件教程);1.智...
透视新版(wpk俱乐部)红龙扑... 透视新版(wpk俱乐部)红龙扑克好友桌(详细辅助科技教程)总是是有挂(1)透视新版(wpk俱乐部)红...
德扑ai智能机器人!微扑克有没... 德扑ai智能机器人!微扑克有没有稳赢的打法,(德州aapoker)最初有挂(详细辅助扑克教程);致您...
透视插件(德扑之星作弊)德州a... 透视插件(德扑之星作弊)德州ai辅助神器燃油(详细辅助透明挂教程)一直真的有挂1)德扑之星作弊辅助挂...
德州之星辅助挂!德扑ai助手,... 德州之星辅助挂!德扑ai助手,(AAPOKEr)其实是真的有挂(详细透视必备教程);最新版2024是...
透视透视挂(德州免费辅助神器a... 透视透视挂(德州免费辅助神器app)微扑克辅助器是真的么(详细辅助力荐教程)竟然真的是有挂1、这是跨...
微扑克辅助挂!德扑ai人工智能... 微扑克辅助挂!德扑ai人工智能,(WEPoke)原本有挂(详细辅助黑科技教程);微扑克辅助挂软件透明...
透视有挂(wepoke是真的有... 透视有挂(wepoke是真的有挂)德扑手牌胜率计算工具(详细辅助必赢教程)好像是真的有挂1、这是跨平...
德州之星插件!aapoker线... 《德州之星插件!aapoker线上有外挂吗,(aapoker)其实真的有挂(详细透视透牌教程)》 德...