V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
MrSnake
V2EX  ›  Python

如何使用 Python 实现特定条件抽样?

  •  
  •   MrSnake · 2022-04-04 13:19:17 +08:00 · 2691 次点击
    这是一个创建于 965 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景

    1. 目前需要进行常态化抽检
    2. 有 10 个班
    3. 学生分散在 N 个宿舍中
    4. 每个宿舍 5 人且不一定来自同一个班
    5. 分男生宿舍和女生宿舍

    抽检条件

    • 抽检五天
    • 每天每个宿舍和每个班级都要有人被抽检

    样例

    [["id1","1 班","男 101"],["id2","1 班","男 102"],["id3","3 班","男 101"],["id4","4 班","男 101"],["id5","1 班","女 101"],["id6","1 班","女 103"],["id7","6 班","女 101"],["id8","7 班","女 101"]]

    15 条回复    2022-04-07 01:30:23 +08:00
    macrorules
        1
    macrorules  
       2022-04-04 13:23:22 +08:00
    这个是数学问题吧,数学上怎么解啊?
    uni
        2
    uni  
       2022-04-04 13:38:37 +08:00
    一天抽几个人?
    dlsflh
        3
    dlsflh  
       2022-04-04 13:40:30 +08:00
    你随便 random 生成抽检单,然后判断是否符合条件,不符合丢弃继续 random 。
    MrSnake
        4
    MrSnake  
    OP
       2022-04-04 13:47:34 +08:00
    @macrorules 这个我也一直在尝试,但是会出现一天堆积的太多的情况
    MrSnake
        5
    MrSnake  
    OP
       2022-04-04 13:47:40 +08:00
    @uni 55 个人
    MrSnake
        6
    MrSnake  
    OP
       2022-04-04 13:47:47 +08:00
    @dlsflh 好的!!我试试!!
    s4nd
        7
    s4nd  
       2022-04-04 16:04:53 +08:00
    按宿舍床位号来就行了,这种情况随机没啥用,随机还有可能连续随机到同一个
    yankebupt
        8
    yankebupt  
       2022-04-04 16:15:50 +08:00
    先抽班,再抽宿舍的同时合并 /复用同类项,人数不够随机补齐不行么。
    看起来人不太多而且也不需要特别科学的抽法的样子……
    MrSnake
        9
    MrSnake  
    OP
       2022-04-04 17:05:22 +08:00
    @s4nd 因为有的宿舍是有空着的,而且要求每个班级每天都有,所以就比较麻烦
    MrSnake
        10
    MrSnake  
    OP
       2022-04-04 17:05:38 +08:00
    @yankebupt 好的!!
    SenLief
        11
    SenLief  
       2022-04-04 17:16:27 +08:00
    “每天每个宿舍和每个班级都要有人被抽检”

    这个好像没给出一共有多少个宿舍。以及每天的抽检人和宿舍、班级是否可以重复。
    wuxkwnjjwoxk
        12
    wuxkwnjjwoxk  
       2022-04-04 18:36:51 +08:00 via iPhone
    分层随机化 stratified sampling 很基础的东西,应该不难搜到教程
    yaphets666
        13
    yaphets666  
       2022-04-05 02:27:26 +08:00 via iPhone
    不想动脑的方法就是,首先所有的班一个 list ,所有的宿舍一个 list ,宿舍比班多,所以先按班抽,每个班抽一个出来。这样子就满足了第一个条件。然后除了第一步被抽中的人得宿舍,其他宿舍每个宿舍抽一个,这样就都满足了。
    yaphets666
        14
    yaphets666  
       2022-04-05 02:30:00 +08:00 via iPhone
    在提高一下条件,尽量抽没被抽中过的人,也不想动脑,那就是每个人加一个 count ,抽到就 count++,在抽每一步之前,所有班和宿舍内部按 count 排序
    BeautifulSoap
        15
    BeautifulSoap  
       2022-04-07 01:30:23 +08:00 via Android
    这还不简单,没说抽几个人的话,10 个班比如总共 500 人,每天把这 500 人都抽出来不就行了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2694 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 10:48 · PVG 18:48 · LAX 02:48 · JFK 05:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.