V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lpdink
V2EX  ›  程序员

兼顾打游戏和训模型的 ALL IN ONE 方案

  •  
  •   lpdink · 3 天前 · 2928 次点击

    50 系在即,准备重新装机,在纠结系统方案了。主要需求是打游戏,写代码( C++/Java)和训模型(cuda )。

    现在是宿主机装 windows11 ,WSL 下训模型和写代码的方案。但是 WSL 的环境,尤其是 GPU 环境很容易炸,N 卡驱动更新,WSL 更新都可能破坏宿主机或宿主机内容器的 GPU 环境,总归和原生 linux 不一样,听说也会损失 10%的 GPU 性能,很难受。

    另外对系统备份和还原也有需求,很想用虚拟机了。

    前段时间听说了 PVE ,感觉很不错,但是试了下发现 Geforce 系列显卡没法做 GPU 虚拟化,只能直通给某个虚拟机,这样直通给 windows 就没法训模型,直通给 linux 就不好打游戏了。

    老哥们现在用的是什么 all in one 方案?有没有什么好办法,充分利用上那张很贵的显卡?

    42 条回复    2024-11-30 21:04:11 +08:00
    wheat0r
        1
    wheat0r  
       3 天前
    我觉得打游戏和 AIO 根本不配套
    bigtear
        2
    bigtear  
       3 天前
    没有好办法,你要想一个系统兼顾打游戏和训练模型,ALL IN Linux 是最佳选择,能打游戏又能方便训练。Windows 训练的性能会稍差。

    PVE 的话,显卡直通 Linux 训练,再买一块显卡插上直通 Windows 打游戏,一台主机兼顾两个需求了。
    visitant
        3
    visitant  
       3 天前
    PVE 显卡直通,打游戏切到 Windows ,训练切到 Linux ?
    RightHand
        4
    RightHand  
       3 天前 via Android
    待机功耗 200w 能接受不???
    a302800411
        5
    a302800411  
       3 天前 via iPhone
    搞多个启动盘不行吗,一块 ssd 装 Windows ,一块装 Linux 。搞个引导管理器,每次开机决定进入哪个系统
    txhwind
        6
    txhwind  
       3 天前
    双系统呗,总不会一边打游戏一边跑训练吧
    baysonfox
        7
    baysonfox  
       3 天前
    如果只对 linux 有备份还原需求感觉可以直接双系统,linux 侧用 btrfs/zfs 做快照备份
    wxd21020
        8
    wxd21020  
       3 天前
    @visitant 细说切显卡
    lerry
        9
    lerry  
       3 天前
    我现在是两块 ssd ,Windows 和 Linux 各自一块盘,装系统的时候只插一块盘。

    哪个用的多默认启动哪个,开机可以选系统
    Biem
        10
    Biem  
       3 天前   ❤️ 2
    可以训练模型打游戏,这样就兼顾了()
    esee
        11
    esee  
       3 天前
    如果你是想用显卡在 win 打游戏 输出画面的同时在 linux 下训练 cuda,那确实办不到,但是如果你是想串流,那完全可以,40 系显卡破解后也能虚拟化, 虚拟后同时给 linux 和 win 用,只是 win 无法输出画面,你用串流的话就可以。如果是不需要同时进行,那更简单了。打游戏的时候直通给 win ,训练的时候直通给 linux ,那不就得了
    xuelu520
        12
    xuelu520  
       3 天前
    先说预算,没预算咋给你兼顾
    reatang
        13
    reatang  
       3 天前
    用 GRUB2 自己做双系统呗
    Jinnrry
        14
    Jinnrry  
       3 天前 via iPhone
    Windows in PVE 有些游戏检测虚拟机,根本过不了风控
    WuDiHaiTai
        15
    WuDiHaiTai  
       3 天前
    @Jinnrry 可以通过修改 conf 规避虚拟机检测,办法很多的。
    wangyzj
        16
    wangyzj  
       3 天前
    嘿,我在想这个问题想了好几天了,没啥特别好办法
    单显卡肯定不可能双活,那就只能双系统,双系统就没啥必要 pve ,直接上 vmware 开一些必要的 vm 就好
    当然最好还是俩显卡,但穷
    总之没啥完美方案
    lpdink
        17
    lpdink  
    OP
       3 天前
    @txhwind @baysonfox 主要是 N 卡配 linux 桌面特别容易爆炸,之前折腾过两次,每次都是更新下驱动,桌面炸了进不了系统....也可能是我对 linux 桌面不熟悉,好不容易搞好驱动,输入法,星火商店,桌面主题美化什么的,重启一下发现爆炸了...爆炸了...两个小时白折腾了。还蛮喜欢 gnome 的
    lpdink
        18
    lpdink  
    OP
       3 天前
    @visitant 老哥,能指点下怎么 PVE 显卡直通下,动态或方便地切换直通的系统吗?
    lpdink
        19
    lpdink  
    OP
       3 天前
    @bigtear 也不是没有钱买多块显卡,但是多买一块 5090 的话,就会想着拿两张 5090 一起训模型了...不然总觉得很可惜
    cbythe434
        20
    cbythe434  
       3 天前
    macbook m4 128G
    Carson089
        21
    Carson089  
       3 天前   ❤️ 1
    不要折腾了。爱玩游戏就好好挑个游戏本,显卡够用最低配就行。 训练模型,笔记本的阉割版显卡完全不够用,分分钟烫手。mac 不用考虑了,玩游戏不行,玩大模型一般部署 int4 甚至 int1 的大模型,准确率差很多的。
    玩大模型就去租用服务器就行,弹性扩展,千问 72B 都可以玩,还可以分部署训练,这是单卡无法比拟的
    yazinnnn0
        22
    yazinnnn0  
       3 天前   ❤️ 1
    直接装 linux, 现在用 proton 打新游戏已经很成熟了, 有的甚至比 windows 下效果还好

    比如黑🐒在 protondb 上都是白金效率
    https://www.protondb.com/app/2358720

    &ab_channel=A1RM4X
    coldle
        23
    coldle  
       3 天前 via Android
    不如说说你打什么游戏,常规 steam epic 游戏在 linux 运行效率都还可以,你要是懒得折腾 N 卡驱动,直接装 bazzite 这种发行版都可以
    coldle
        24
    coldle  
       3 天前 via Android
    @coldle #23
    bazzite 在 N 卡下除了 gamescope 用不了,其他应该都属于开箱即用。不过 50 刚出来的时候驱动是否能及时跟上我还真不确定
    lbp0200
        25
    lbp0200  
       3 天前
    wsl 下显卡性能损失 10%,又不是什么大问题,就是开发调试
    zuotun
        26
    zuotun  
       3 天前
    @esee #11 显卡怎么虚拟化?我记得从 30 系开始就不支持了啊
    impdx
        27
    impdx  
       3 天前   ❤️ 1
    显卡直通吧,俩块显卡就行了。pve 或者 exsi 。我是习惯 exsi 了。unraid 也可以。不过注意虚拟化的 win10 打游戏要过反作弊的虚拟化检测,所以你大概率还要直通 cpu 核心,直通一堆。还需要改很多配置文件。当反作弊一更新又要改。。。

    所以我的建议是!买一台 dell r430/720 这类 2u 服务器,上暴力风扇,不会太贵,准系统就够了。

    折腾 pve 和 allinone 的时间和金钱,可能不如分开来的省钱。

    我以前也是 all in one 。unraid ,单显卡直通 win 打游戏。直到抛弃了 3950x ,换了 x3d ,打游戏真爽。直接 2000 多买了一台 r430 ,不带显卡。
    impdx
        28
    impdx  
       3 天前
    虚拟化 gpu 要授权。特殊显卡比如 grid 的驱动就可以虚拟化。一般不用考虑了。正常要虚拟化 gpu 只能 hyperv 。单 hyperv 这玩意吧。。。
    dayeye2006199
        29
    dayeye2006199  
       3 天前 via Android
    Steam on linux
    m1nm13
        30
    m1nm13  
       3 天前
    你装个双系统不就完了
    blacktail
        31
    blacktail  
       3 天前
    消费级显卡不支持 vgpu ,网上的方法要不过时了,要不就是用扭曲的方式解决。所以又要训练又要玩游戏最省心的是插两张卡,除了费电都挺好。
    Donaldo
        32
    Donaldo  
       3 天前
    痛点都被你列完了,真的不如去租算力。。。
    MartinYANG06
        33
    MartinYANG06  
       3 天前
    装个双系统呗, 该打游戏打游戏, 该训练模型训练模型。
    整个软路由,弄个 ssh 端口映射,远程连接家里的电脑搞开发训练模型,省的每次租 gpu 服务器和配置环境麻烦。
    neilyoone
        34
    neilyoone  
       3 天前   ❤️ 1
    试试 系统装 Ubuntu 桌面版, KVM 搞 Linux/Windows 虚拟机.
    显卡直通给 Windows 虚拟机, 然后其他设备串流到 Windows 打游戏.
    不打游戏的时候, 关闭 KVM, Ubuntu 下就能把显卡用起来跑训练.
    neilyoone
        35
    neilyoone  
       3 天前
    忘了说, 我的设备就是这样搞的
    nrtEBH
        36
    nrtEBH  
       3 天前
    搞个游戏主机 模型什么的租云资源就好了
    ShadowPower
        37
    ShadowPower  
       3 天前   ❤️ 1
    其实在 WSL 下训练的模型越大,性能损失越小,NVIDIA 的博客里有相关细节:
    https://developer.nvidia.com/zh-cn/blog/leveling-up-cuda-performance-on-wsl2-with-new-enhancements/

    我以前用 Linux 环境,然后发现折腾 Linux 串流游戏问题更多……
    在某一天,部署好的 VNC 服务不知道为什么死活连不上了,然后回到了 Windows+WSL 。

    装好就禁用 Windows 更新,并且除非有明确的理由(更新驱动可以解决目前遇到的问题),否则驱动也不更新。
    用 WSL 顺便还解决了备份还原的问题,也不用折腾 Linux 驱动了。
    swulling
        38
    swulling  
       3 天前
    感觉很多人都在说 xx 环境「炸」。

    不管是 WSL 也好,Linux Desktop 也好,软件上很难见到莫名其妙故障的,熟悉环境,也没啥问题。
    lpdink
        39
    lpdink  
    OP
       3 天前 via Android
    @swulling 更新会引入问题的,老哥。我怀疑 wsl 的稳定性主要是因为这个 issue 。虽然是两年前提的了,但今年隔三差五还有人 @我...https://github.com/microsoft/WSL/issues/9962
    这次后就想着要换原生 linux 了的
    bluearc
        40
    bluearc  
       2 天前
    30 系和以前的消费级显卡可以用 vgpu_unlock 解锁虚拟化,解决你的所有问题,但看你似乎想上 50 系?如果只有打游戏和训练、部署模型的需求,没有需要持久运行的服务,那还是老实用双系统吧;要么就在 win 上凑合用 wsl ,要么在 linux 上打游戏,其实这两个也很成熟了
    ISVStar
        41
    ISVStar  
       2 天前
    @lpdink wsl 套 docker 确实会有问题,特别是网络。不套 docker 就行
    ykk
        42
    ykk  
       2 天前
    mac+remote 训练集群 win10 台式机打游戏
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1047 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 19:42 · PVG 03:42 · LAX 11:42 · JFK 14:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.