V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
fuchaofather
V2EX  ›  NAS

immich 重磅更新 OCR

  •  
  •   fuchaofather · 19 小时 48 分钟前 · 3067 次点击

    immich 最新 release开始正式支持 OCR ,当前近乎已经是相册管理的完全体了。

    分享下我的硬件:

    • OES (¥ 99 )部署immich_server,immich_postgres
    • OECT(¥ 80)部署immich_machine_learning 可以用到 rk3566 的 npu 加速
    30 条回复    2025-11-01 01:08:43 +08:00
    unhappy224
        1
    unhappy224  
       19 小时 40 分钟前
    我想问问这套硬件跑起来会有性能问题吗?例如新导入几千张照片这样,扫描要多久?
    如果买好点的 n150 甚至是 7840 那一堆,会快多少?
    kuanos
        2
    kuanos  
       19 小时 29 分钟前
    immich 在 qnap 上每次布置都失败,很绝望啊
    Aprdec
        3
    Aprdec  
       19 小时 19 分钟前
    immich app 一次上传几百张 有 bug
    fuchaofather
        4
    fuchaofather  
    OP
       19 小时 18 分钟前
    @unhappy224 跟你选的模型也有关系,可以参考(官方文档)[https://docs.immich.app/features/searching]根据你的配置(内存、ARM 、CUDA 还是 RKNN )选择合适的模型。我的 oect 是 RKNN+4G 内存所以选择了`ViT-B-16-SigLIP-i18n-256__webli`,图片识别大概 1 秒 3-4 张的样子,OCR 因为 CPU 比较孱弱 6 秒一张
    mooyo
        5
    mooyo  
       19 小时 15 分钟前
    一更新就挂了。。
    [Nest] 6 - 10/31/2025, 10:33:29 AM LOG [Microservices:WebsocketRepository] Initialized websocket server

    Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26) {

    errno: -3001,

    code: 'EAI_AGAIN',

    syscall: 'getaddrinfo',

    hostname: 'database'

    }

    microservices worker error: Error: getaddrinfo EAI_AGAIN database, stack: Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26)

    microservices worker exited with code 1

    Killing api process

    没看到 release 上写了啥 breaking changes 啊。。
    fuchaofather
        6
    fuchaofather  
    OP
       18 小时 48 分钟前
    @mooyo 你是哪个版本上来的啊,我每个版本都在跟没啥问题
    mooyo
        7
    mooyo  
       18 小时 46 分钟前
    @fuchaofather #6 解决了。。看了下日志,是我的 pg 数据库启动的时候发现没空间,没拉起来。

    没空间的原因是我的这个虚拟机(跑在 mac mini 上的)只分配了 30G 空间( photo 是网络挂载的),我以为够了,其实已经被 docker 镜像塞满了。。
    lu5je0
        8
    lu5je0  
       18 小时 35 分钟前
    还差个 ultra HDR
    mogita
        9
    mogita  
       18 小时 19 分钟前
    同在 OECT 上运行,五千多照片视频,简直游刃有余。
    mooyo
        10
    mooyo  
       18 小时 13 分钟前
    mac mini 上有办法搞到硬件加速么?跑 docker 上看起来 OCR 性能不太行
    NoDataNoBB
        11
    NoDataNoBB  
       17 小时 34 分钟前
    有支持中文地图的方案吗
    faketemp
        12
    faketemp  
       17 小时 26 分钟前 via iPhone
    immich 虽好部署维护太难了 一不小心各种报错 gpu 核显调用也各种配置各种问题 折腾几次都很难完美跑起来 等有一键整合版再研究🧐
    SenLief
        13
    SenLief  
       17 小时 1 分钟前 via iPhone
    @NoDataNoBB 图源应该没办法改吧,只能把城市这些改为中文。
    chenluo0429
        14
    chenluo0429  
       16 小时 31 分钟前 via Android
    ocr 是真的慢,从早上开始的任务,15000 的资源 3 个并发,现在还有 1000+没跑完
    fuchaofather
        15
    fuchaofather  
    OP
       16 小时 26 分钟前
    @mooyo #10 我试过,有难度。你可以去 discuss 里找找看
    mooyo
        16
    mooyo  
       16 小时 10 分钟前
    @fuchaofather #15 感谢指引,看到了。

    思路是单独运行 machine-learning-svr 到一个支持 ml 的环境(裸环境直连 gpu ,tpu )。

    这个思路适用于存算分离的场景
    Xiaosteven
        17
    Xiaosteven  
       15 小时 17 分钟前
    我用 3090 的训练 ocr 真的慢,10 个并发直接干重启,改成 3 个并发,平均 10 秒 3 个...
    zhucegeqiu
        18
    zhucegeqiu  
       15 小时 10 分钟前   ❤️ 1
    sky300
        19
    sky300  
       15 小时 6 分钟前
    实在折腾不起了 直接入了个 MTPhotos ,省心了。
    rfrftt
        20
    rfrftt  
       14 小时 56 分钟前
    ocr j4125 上 nllb-clip-large-siglip__v1 模型, 差不多 20s 处理一张图
    Jasonqiao
        21
    Jasonqiao  
       14 小时 53 分钟前
    原来 OCR 这么吃性能么,以为是一个基础功能呢
    dobelee
        22
    dobelee  
       13 小时 53 分钟前
    没有 NPU 的群晖能跑吗?
    fuchaofather
        23
    fuchaofather  
    OP
       13 小时 8 分钟前
    @dobelee 能跑,有 gpu 也行,就是快慢的问题
    fuchaofather
        24
    fuchaofather  
    OP
       13 小时 7 分钟前
    @Jasonqiao 用的 PaddleOCR ,中文识别效果应该会很好
    YsHaNg
        25
    YsHaNg  
       11 小时 59 分钟前 via iPhone
    @faketemp n 卡 docker compose 一键起完全没问题
    SatoZ
        26
    SatoZ  
       10 小时 53 分钟前
    试了一下 发现效果极差啊 识别率非常低
    lianyanjiajia
        27
    lianyanjiajia  
       6 小时 41 分钟前
    直接用飞牛了
    mooyo
        28
    mooyo  
       6 小时 15 分钟前
    实测 coreml 上目前有问题,discussion 里面也提到了一样的报错....

    macmini 的可以不用尝试了
    git00ll
        29
    git00ll  
       5 小时 16 分钟前
    这一版同步文件有问题,建议再等一版
    iX8NEGGn
        30
    iX8NEGGn  
       4 小时 40 分钟前
    传统的 OCR 性能好,但有个缺点,单词换行就搜不出来了,大模型 VLM 又是太耗性能,immich 使用 PaddleOCR 有处理换行问题吗?
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   881 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:49 · PVG 05:49 · LAX 14:49 · JFK 17:49
    ♥ Do have faith in what you're doing.