有用 Mac 跑 deepseek 模型的么，效果怎么样，有坑没有

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Support

› 根据产品序列号查看状态

有用链接

› Apple 产品更新周期

› Other World Computing 性能升级

› Apple 软件 Beta 测试

这是一个创建于 269 天前的主题，其中的信息可能已经有所发展或是发生改变。

看到有人评论，说 9G 内存就够跑 Qwen 14B 了，效果直逼 o1mini ，高配 32B 都可以跑。

求证一下，有没有大佬已经上手了，感觉怎么样。

Mac

DeepSeek

qwen

35 条回复 • 2025-02-10 11:35:35 +08:00

spike0100

269 天前 via iPhone

本地模型出错率还是挺高的。问了下中国历史上的首都都有哪些，啪啪啪 think 了一堆，但是最后回答的几个朝代没一个对的。但是官网的回答是没错的。

vipviphaha

269 天前

9g 内存跑 14b ，速度不行

0619

269 天前

M1 Max 64G 32b 速度可以用，70b 速度非常慢

0619

269 天前

@spike0100 32b 回答没问题

tanrenye

269 天前

试了一下 7b ，不太行的感觉，还有混着英文来回答，估计要 14b 以上会好一点，不如 qwen2.5 的 7b

windirt

268 天前

16G M1 Pro ，关掉所有 app 能跑 14B

jiuzhougege

268 天前

32G 内存跑 32B, 20G 的模型文件，无压力

GabrielleBellamy

268 天前

128gb 内存跑 32b 中。

hearlessnor

268 天前

@windirt 速度如何，回答质量如何？

pricky777

268 天前

16G 的 M2 跑 7b ，错误挺多的，跑 14b 的话内存直接炸了，结果也没好到哪里去

neilxu

268 天前

与楼上不同，我 16G 的 M1 ，ollama 跑 14b ，速度不慢，内存占用 12G ，回答质量和速度都可以，问的是苏联和蒙古的历史问题，跟 ds 官网的答案差不多，没有明显减少字数。
就是 air 没风扇，输出的时候温度 88-90 度，输出完就降温了。

zeyangstudies

267 天前

跑了 32b 的 4bit 量化的 mlx 版本，感觉挺好用~

skylha

267 天前

@zeyangstudies 老哥你是啥配置？有比直接跑 7b 效果好吗？

zeyangstudies

267 天前

@skylha 我的是 48g 的 M3 ，没试过 7b 的诶

18m

266 天前 via Android

@skylha 同关注

sunmker

266 天前

@spike0100 我也是，本地跑 1.5B 和 7B 都不太行，不如通义千问。官网的确实还可以的

hiiragiharunatsu

266 天前

m4 的丐版 16+256 跑 14b 大概 9tok 蹦字很慢效果也不好 thinking 时间巨长感觉还不如 8b 那个舒服

idlerlestat

266 天前

蒸馏版 14b 在 16G m3 air 上跑问题不大
至于完全版的，真想在 mac 上跑的估计要这样
https://x.com/exolabs/status/1872444906851229814

sheller

266 天前

@zeyangstudies 求个链接，谢谢

wsbqdyhm

265 天前 via iPhone

@0619 #3 配置一样，32b 和 70b 我都安装了，可以接受。ds 真的好很多，国内妥妥的第一，中文也比免费版的 chatgpt 强，付费版没有试过

winson030

264 天前 via iPhone

话说。能跑是能跑，但是效果怎样？ 32gb m1pro 跑哪个规格的模型是能用好用的？

kimizen

264 天前

看有人用 8 个 mac mini 跑成功了

findex

263 天前

@hiiragiharunatsu 这个效果确实不如几百瓦功耗的 N 卡。m4 ultra 应该会好很多，目前 mac 的瓶颈卡在内存/显存带宽上。其他都是浮云

SGL

263 天前

我想问下本地跑 deepseek 模型的意义是什么，回答质量也不高，纯为了玩儿吗

lrigi

263 天前 via iPhone

@SGL 隐私保护，也不是所有问题都要在线问

Donaldo

263 天前

32b 起吧，14b 效果太差了，32b 也很慢，而且开了十几 G 内存没了，本身内存就捉急。。

wsbqdyhm

263 天前

@SGL 在线问三天打鱼两天晒网，服务器崩来崩去，真是无语，还是本地靠谱，讲真，有些问题本地比在线要来得好。

Themyth

263 天前

我是 36G 内存一开始跑 70b 卡死……跑 32b 速度挺快的，但是挺弱智的。。。

zeyangstudies

260 天前

@sheller 就在 modelscope 上搜 mlx deepseek r1 就行，一堆，然后用 xinference 来推理，chatbox 对话就可以~

zeyangstudies

260 天前

@SGL 就是一般在断网环境下，例如某些加密网下搞工程，有个随时就问的大模型也挺好的

bugprogrammer

260 天前 via iPad

Mac mini m4 pro+48g ，跑的 14b ，速度很 OK 。模型放 nas 上了，万兆，nfs 协议。用着挺舒服。另外我的 Debian arm 虚拟机也放 nas 上了(玩玩 arm Linux)。

Vapriest

260 天前

16G14B ，比较卡，且效果对比网页版有明显差距

bugprogrammer

256 天前

我又测试了一下，ollama 跑 deepseek-r1:32b 9.72 tokens/s. 跑 14b 19.54 token/s 。

bugprogrammer

256 天前

配置是 m4pro+48g 的 mini

abslut

256 天前 via iPhone

M4 丐版跑的 14b ，挺流畅的，就是比较傻