这几天组装了一台双 2080ti 机器,用来跑深度学习模型,但是经常会跑一会就出现重启,甚至直接进入 bios 了,通过 nvidia-smi 对于显卡温度的观察,同时使用两块卡的时候,第一块的温度上升速度高于第二块卡,一般达到 80 度左右就会重启,初步怀疑是显卡的问题,调换显卡后还是相同位置的显卡温度过高。请问大家可能是什么原因呢,如何去解决,目前想的解决方案是加 gpu 水冷,或者加大风扇力度,不过还是不太明白为什么只有一块卡温度上升的快。电脑配置如下:
显卡:两块技嘉 RTX2080TI
固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW )
CPU:英特尔( Intel ) i9-10850K 10 核 20 线程 盒装 CPU 处理器
电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保)
机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡)
主板:玩家国度( ROG ) ROG STRIX Z490-A GAMING 吹雪主板 支持 CPU 10900K/10700K ( Intel Z490/LGA 1200 )
内存:四块金士顿(Kingston) DDR4 2666 16GB 台式机内存条
水冷:九州风神( DEEPCOOL ) 堡垒 360 CPU 水冷散热器 幻彩 RGB 版(一体式水冷 /静音 /3 个 ARGB 风扇 /稳压 I9/标配硅脂)
1
cowarder OP 排版出现问题,评论里再放一下
显卡:两块技嘉 RTX2080TI 固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW ) CPU:英特尔( Intel ) i9-10850K 10 核 20 线程 盒装 CPU 处理器 电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保) 机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡) 主板:玩家国度( ROG ) ROG STRIX Z490-A GAMING 吹雪主板 支持 CPU 10900K/10700K ( Intel Z490/LGA 1200 ) 内存:四块金士顿(Kingston) DDR4 2666 16GB 台式机内存条 水冷:九州风神( DEEPCOOL ) 堡垒 360 CPU 水冷散热器 幻彩 RGB 版(一体式水冷 /静音 /3 个 ARGB 风扇 /稳压 I9/标配硅脂) |
2
3dwelcome 2021-05-13 15:14:30 +08:00
Windows 下显卡原因的蓝屏重启,是会有 crash dump 报告的,打开后能查到确切原因。
显卡 80 度,感觉完全在可接受范围内。 |
3
elmagnificogg 2021-05-14 09:20:03 +08:00 via Android
大概率是电源有问题,换个电源试一下
|