V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mrfox
V2EX  ›  Firefox

firefox 有个开源的本地大模型 https://future.mozilla.org/blog/introducing-llamafile/,什么样的机器能跑动

  •  1
     
  •   mrfox · 2023-12-29 08:53:15 +08:00 · 2429 次点击
    这是一个创建于 365 天前的主题,其中的信息可能已经有所发展或是发生改变。
    小主机行吗
    18 条回复    2023-12-31 21:35:03 +08:00
    qping
        1
    qping  
       2023-12-29 09:03:20 +08:00
    没说要什么样的机器,但是说了 Supported OSes and CPUs 和 GPU support
    https://github.com/Mozilla-Ocho/llamafile

    要不你下了试试?
    godmiracle
        2
    godmiracle  
       2023-12-29 09:09:40 +08:00
    我用 m1 就能跑起来。x86 的好像不行,没跑成功
    qping
        3
    qping  
       2023-12-29 09:19:58 +08:00
    amd 7950x 可以跑,还挺顺畅的
    有意思
    mrfox
        4
    mrfox  
    OP
       2023-12-29 09:38:05 +08:00
    @qping 谢谢
    bfdh
        5
    bfdh  
       2023-12-29 09:59:44 +08:00
    i7-12700 Linux 可以跑
    Seanfuck
        6
    Seanfuck  
       2023-12-29 10:15:09 +08:00
    貌似是可以直接运行的文件:
    AMD64 微处理器必须具有 SSSE3 。否则 llamafile 将打印一个错误并拒绝运行。这意味着,如果你有一个英特尔 CPU ,它需要是英特尔酷睿或更高版本(大约 2006 年以上),如果你有一个 AMD CPU ,那么它需要是推土机或更高版本(大约 2011 年以上)。如果你有一个较新的 AVX CPU ,或者更好的 AVX2 ,那么 llamafile 将利用你的芯片组特性去更快。目前还不支持 AVX512+运行时调度。

    话说支持中文吗?
    weilongs
        7
    weilongs  
       2023-12-29 10:42:43 +08:00
    两周前看到这个跑过一下,我用的 MacBook pro 2019 款哪个 intel 的本子跑了一下,提出一个问题风扇就起飞了。体验感觉还不错,我体验了 LLaVA 1.5 和 Mistral 7b 。
    jifengg
        8
    jifengg  
       2023-12-29 10:52:24 +08:00
    有意思,去体验一下
    titan2022
        9
    titan2022  
       2023-12-29 10:58:04 +08:00
    4800H 也能跑,速度不算快 有中文
    paopjian
        10
    paopjian  
       2023-12-29 12:44:21 +08:00
    用默认模型跑起来崩溃,用 Mistral 试了试,真不错啊,速度也有
    zsh2517
        11
    zsh2517  
       2023-12-29 13:29:44 +08:00
    @qping #3 同 7950x ,远程下载到 NAS 了,晚上回去试试
    zsh2517
        12
    zsh2517  
       2023-12-29 14:08:17 +08:00
    NAS 上下完了一个模型,先试了试,可能 D1851 太老了,而且这种活可能本来也不适合 CPU 跑。速度感觉一般,而且没有 stream 模式。晚上拿台式机试试

    ---

    对话截图 => ![]( https://s2.loli.net/2023/12/29/vFrw1DkhxbVc4m8.png)
    控制台截图 => ![]( https://s2.loli.net/2023/12/29/yCoOD8TmZgkfIeG.png)

    宿主环境 D-1581 32 核 64G ,pve LXC 容器
    运行参数 ./llava-v1.5-7b-q4-server.llamafile --host 0.0.0.0 --port 1234 --threads 32
    woyao
        13
    woyao  
       2023-12-29 14:39:05 +08:00
    @zsh2517 图一对话中的拼音很诡异……
    elonlo
        14
    elonlo  
       2023-12-29 14:41:21 +08:00
    我 windows 都跑起来了。i5-13500H
    NoOneNoBody
        15
    NoOneNoBody  
       2023-12-29 14:44:54 +08:00
    @woyao #13
    同感
    bang chu xian ni... 看上去也不是给歪果仁阅读的
    Rache1
        16
    Rache1  
       2023-12-29 15:50:49 +08:00
    速度还行,就是不知道为啥,有时候会卡住 😂
    iold
        17
    iold  
       2023-12-29 16:15:24 +08:00

    根据说明 Windows 下载完,加个.exe,双击执行,会自动打开浏览器。
    qping
        18
    qping  
       362 天前
    @Seanfuck 支持
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2848 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:57 · PVG 16:57 · LAX 00:57 · JFK 03:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.