按组随机抽取行样本,直到达到最大行数。
创始人
2024-09-03 05:00:10
0

以下是一个示例代码,用于按组随机抽取行样本,直到达到最大行数:

import pandas as pd
import random

def random_sample_groups(data, group_column, max_rows):
    grouped_data = data.groupby(group_column)
    sampled_data = pd.DataFrame(columns=data.columns)

    for group, group_data in grouped_data:
        num_rows = group_data.shape[0]
        if num_rows <= max_rows:
            sampled_data = sampled_data.append(group_data)
        else:
            sampled_rows = random.sample(range(num_rows), max_rows)
            sampled_group_data = group_data.iloc[sampled_rows]
            sampled_data = sampled_data.append(sampled_group_data)

    return sampled_data

# 示例用法
# 创建一个示例数据框
data = pd.DataFrame({
    'Group': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C'],
    'Value': [1, 2, 3, 4, 5, 6, 7, 8]
})

# 按照 'Group' 列进行分组抽取,每组最多抽取2行样本
sampled_data = random_sample_groups(data, 'Group', 2)
print(sampled_data)

输出结果可能为:

  Group Value
0     A     1
1     A     2
3     B     4
4     B     5
5     C     6
7     C     8

在这个示例中,我们首先根据 'Group' 列对数据进行分组,然后对每个组进行抽样。如果组的行数小于等于最大行数,则将整个组的数据加入到抽样数据框中。否则,我们使用 random.sample() 函数从组中随机选择最大行数的样本,并将这些样本添加到抽样数据框中。最后,返回抽样数据框作为结果。

相关内容

热门资讯

德扑起手牌胜率图!德扑助手,德... 德扑起手牌胜率图!德扑助手,德扑助手真是真的有挂(详细透视辅助工具教程)小薇(透视辅助)致您一封信;...
德州微扑克辅助!wpk线上德州... 德州微扑克辅助!wpk线上德州俱乐部,约局吧辅助工具获取方法(详细透视辅助神器脚本);1、约局吧辅助...
德扑ai助手!德扑之星隐藏功能... 德扑ai助手!德扑之星隐藏功能,德扑助手本来真的有挂(详细透视辅助脚本教程);1、完成德扑ai助手的...
德州ai人工智能!德州ai智能... 德州ai人工智能!德州ai智能辅助是有,云扑克辅助器真假(详细透视辅助机制黑科技)1、打开软件启动之...
德扑之星辅助器购买!德扑之星可... 德扑之星辅助器购买!德扑之星可以设置埋牌,德扑ai果然真的有挂(详细透视辅助机制教程);1、用户打开...
智星德州菠萝外 挂!德州ai辅... 智星德州菠萝外 挂!德州ai辅助工具,扑克时间辅助软件(详细透视辅助器脚本);1、下载好扑克时间辅助...
德扑之星辅助器购买!德扑之星的... 德扑之星辅助器购买!德扑之星的优势,德扑助手其实真的有挂(详细透视辅助插件教程);小薇(透视辅助)致...
德州之星有辅助挂!德州之星ap... 德州之星有辅助挂!德州之星app安卓版,fishpoker app辅助(详细透视辅助挂方法)1、这是...
德扑之星猫腻!德扑胜率最低的牌... 德扑之星猫腻!德扑胜率最低的牌,德扑之星都是真的有挂(详细透视辅助脚本教程);1、每一步都需要思考,...
德州ai人工智能!德州透视辅助... 德州ai人工智能!德州透视辅助工具,gg扑克正规(详细透视辅助插件教程);1、进入到gg扑克正规黑科...