coefu

coefu

V2EX 第 616381 号会员,加入于 2023-02-28 17:15:35 +08:00
根据 coefu 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
coefu 最近回复了
https://mp.weixin.qq.com/s/Z6MzHAWhS6duLg5y1hDCYg

学术都被中转站毒害了,当然咯,都是一些水论文的。
2 天前
回复了 sslzjx 创建的主题 生活 明天去见女方家长,这套配置怎么样
@Fish1024 论嘴臭,还得是你小子,哈哈,😄
3 天前
回复了 davidyin 创建的主题 Local LLM 如何在 vs code 上应用自建的 ollama 模型
@davidyin 搞是能搞成的,工程角度来看,是有办法的,只是麻烦。你自己要学一堆东西先。你这种需求,不是共性需求,没人造轮子的。
@diudiuu #8 谢谢你先,但是我没搞🦞。而且,我对🦞这个方向没什么兴趣,😄。

去年这个时候,我把 langchain/rag 那套都搞过一遍,没什么意思。LLMs 整个领域,我都只用而已。
@diudiuu #5 我几百块的成本捡的垃圾,都组了一个智能密度看起来还可以的♾️tokens 。只是有时候慢一点。😄
@diudiuu #5 不差钱的话,全都买啊。mac studio m3 ultra 要是不搞 512g mem ,意义不大,顶配要 10w ,比 dgx spark 贵太多了。如果预算有限,就 dgx spark 咯?反正现在小模型的智能密度很高了。你要专业性和准确性的话,用 rag 提升,当前 ocr 和 rerank 都发展的不错了。

mac studio m3 ultra 可以串起来,组一个 1T mem 的组合 跑 671B 的 deepseek 。不差钱儿的话,这个肯定更好。
@diudiuu https://www.v2ex.com/t/1126516

小伙子,在我面前耍大刀了啊。我只是没有钱买 dgx-spark 。
3 天前
回复了 neteroster 创建的主题 Apple Macbook Neo
@unneeded #2 吝啬这一块,还得是 apple 。
3 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
@cat9life #5 你集成的 gpu tensor core 和 gmem bandwidth ,肯定其中有一个是瓶颈,或者两个都是。
3 天前
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
@cat9life #5 我刚才加上了 open-webui ,然后在里面让它读网页 URL ,确实耗时一点,但是真能读。并且内容分析的还可以,中规中矩,没有胡说八道。确实很夯了。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3000 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 13:33 · PVG 21:33 · LAX 06:33 · JFK 09:33
♥ Do have faith in what you're doing.