Python 按比例获取样本数据或执行任务的实现代码

脚本专栏 2026/6/30 佚名

3 2 1

按比例获取样本数据或执行任务

By:授客 QQ：1033553122

开发环境

win 10

python 3.6.5

需求

已知每种分类的样本占比数，及样本总数，需要按比例获取这些分类的样本。比如，我有4种任务要执行，分别为任务A，任务B，任务C，任务D, 要求执行的总任务次数为100000，且不同分类任务执行次数占比为 A:B:C:D = 3:5:7:9，且在宏观上这些任务同时进行

代码实现

#!/usr/bin/env python
# -*- coding:utf-8 -*-
 
 
__author__ = 'shouke'
 
import time
from copy import deepcopy
 
 
def main():
 
  class_propotion_map = {'A':3, 'B':5, 'C':7, 'D':7} # 分类及样本数比例映射
  class_list = [] # 分类
  class_proption_list = [] # 存放分类样本数比例
 
  for class_type, propotion in class_propotion_map.items(): # 同一个循环，可以保证比例索引和对应分类索引一一对应
    class_list.append(class_type)
    class_proption_list.append(propotion)
 
  temp_class_propotion_list = deepcopy(class_proption_list)
  result = []
 
  t1 = time.time()
  total_sample_num = 100000 #任务执行次数
  for i in range(1, total_sample_num+1):
    max_propotion = max(temp_class_propotion_list)
    if max_propotion > 0:
      index = temp_class_propotion_list.index(max_propotion)
      result.append(class_list[index])
      temp_class_propotion_list[index] -= 1
    elif max_propotion == 0 and min(temp_class_propotion_list) == 0:
      temp_class_propotion_list = deepcopy(class_proption_list)
      index = temp_class_propotion_list.index(max(temp_class_propotion_list))
      result.append(class_list[index])
      temp_class_propotion_list[index] -= 1

  t2 = time.time()
  from collections import Counter
  c = Counter(result)
  for item in c.items():
    print(item[0], item[1]/total_sample_num)
  print('耗时：%s'%(t2-t1))
 
main()

运行结果

说明

以上方式大致实现思路就是，获取每种分类样本数所占比例副本数据列表，然后每次从中获取最大比例值，并查找该比例值对应的分类(获取分类后就可以根据需要构造、获取分类样本数据)，找到目标分类后，把比例数据副本中该比例值减1，直到最大比例和最小比例都等于0，接着重置比例副本数据为样本数比例值，重复前面的过程，直到样本数达到目标样本总数，这种方式实现的前提是得提前知道样本总数及不同分类样本数所占比例，且比例值为整数

Python获取样本数据,python执行任务

标签：

Python获取样本数据,python执行任务

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

内蒙古资源网 Copyright www.nmgbbs.com

评论“Python 按比例获取样本数据或执行任务的实现代码”

Python 按比例获取样本数据或执行任务的实现代码

暂无“Python 按比例获取样本数据或执行任务的实现代码”评论...

www.nmgbbs.com 内蒙古资源网

129,905影音资源

244,626技术资源

111,817软件资源

578,645站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2026/6/30

可与Spreadsheets媲美的在线表格系统:EditG

2026/6/30

cygwin使用心得

2026/6/30

脚本的DVD开发

2026/6/30

局域网设置自动配置脚本文件的写法与用途

2026/6/30

一句话新闻

一口气升级7个大模型SaaS应用，百度智能云：突出一个“开箱即用” - 2026/6/30

这一波大模型产业落地浪潮里，不少企业其实处在 “干瞪眼“的状态。

一种情况是，很多大模型产品看得见却摸不着，在台上一个个遥遥领先——今天Sora技精四座，明天英伟达的机器人又赢得满堂彩，可是到了台下一问：啥时候能用上啊？答曰：遥遥无期。

另一种情况是，企业想用上大模型，却又难免瞻前顾后——既要考虑场景融合，又得兼顾安全性，还要考虑打通现有系统，再加上各种部署成本和繁琐的采购流程……最后只能拂袖：罢了，再等等吧。

Python 按比例获取样本数据或执行任务的实现代码

Python获取样本数据,python执行任务

django中cookiecutter的使用教程

Python批量删除mysql中千万级大量数据的脚本分享

评论“Python 按比例获取样本数据或执行任务的实现代码”

稳了！魔兽国服回归的3条重磅消息！官宣时间再确认！

友情链接