V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ChatGOP
V2EX  ›  问与答

有兄弟做过 AI Translator 没有?用什么 LLM 和框架, 效果怎么样?谢谢了!

  •  
  •   ChatGOP · 87 天前 · 986 次点击
    这是一个创建于 87 天前的主题,其中的信息可能已经有所发展或是发生改变。
    9 条回复    2025-06-10 20:58:48 +08:00
    wyntalgeer
        1
    wyntalgeer  
       87 天前
    16B 以下的小模型都行
    ChatGOP
        2
    ChatGOP  
    OP
       87 天前
    @wyntalgeer 可以实时翻译吗?可以 text->voice 以及 voice->text 翻译吗?
    wyntalgeer
        3
    wyntalgeer  
       87 天前
    @ChatGOP Text-To-Text 没有问题。你说的 text->voice 是 TTS 看一下酒馆,voice->text 是 STT 我不了解是否有现成的方案
    TTS 和 STT 如果做产品,那都是要自建的
    Ta0Ta0Ta0
        4
    Ta0Ta0Ta0  
       87 天前
    看啥场景,在中英文翻译上,NMT 足够了,上 LLM 有点奢侈。
    ChatGOP
        5
    ChatGOP  
    OP
       87 天前
    @Ta0Ta0Ta0 一般文件翻译 LLM 和 NMT 哪个好些? NMT 可以做到实时吗?
    conhost
        6
    conhost  
       87 天前
    @ChatGOP text->voice 以及 voice->text 翻译目前还没有现成的方案,还处于研究阶段,如果你不介意质量也可以用。现有的这些翻译是通过文本翻译前面或后面加 TTS 或者 ASR 实现。
    另外通用领域 NMT 与 LLM 的效果是持平甚至不如的,某些特定领域可能 NMT 的效果会好一点。另外不太明白你这个实时指的是什么?
    ChatGOP
        7
    ChatGOP  
    OP
       87 天前
    @conhost 看到 Google TTS 和 Google STT 都有, 可能精度不高。 实时指的是比如 Chatbot 里面打一段文字,立即就翻译出来了。有必要从 BERT 转换成 GPT 吗?
    conhost
        8
    conhost  
       87 天前
    @ChatGOP TTS 和 STT 技术是现成的,就是工程构建的过程。另外你说的实时的话,不进行特定优化的话,NMT 的翻译一句话的时延大概在 500ms ,LLM 采用的是相同的解码方案,解码时间也差不多,但是 LLM 模型更大,计算更耗时。但是现在硬件设备针对 LLM 也有一定的针对性的优化,所以基本上是能保证的。
    pike0002
        9
    pike0002  
       86 天前
    用 Google Gemini 就可以吧,1.5 Flash 都是免费的(不是特别长的话,特别长可以截断分批处理),2.0 也不是很贵。如果要转 voice ,可能就是先用 Gemini 翻完再用 TTS (知识比较有机器感)?

    我使用 Gemini 比较多,觉得效果比较好。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3219 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 10:37 · PVG 18:37 · LAX 03:37 · JFK 06:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.