V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jarl
V2EX  ›  问与答

数字人视频 API 平台调研对比,想听听大家的建议

  •  
  •   jarl · 3 天前 · 756 次点击

    最近公司有个需求,需要在产品里接入数字人视频相关的 API 。老板的想法是先小规模试运营看看效果,所以前期不太想投入太多资金。我的需求大致如下:

    1. 基础要求:支持不限量或能大量定制数字人 + 声音克隆。
    2. 视频对口型:视频 + 文本 + 定制声音 → 新的视频。
    3. 图生视频:照片 + 文本 + 定制声音 → 新的视频。
    4. 上传营销视频生成:上传现成的营销视频 + 自己的照片 + 自己的音频或文本 + 克隆的声音,生成新视频。(目前只看到阿里通义万相的“通用视频编辑-局部编辑”,0.70 元/秒可以实现,但效果真的不太行)

    第 4 点其实已经不抱希望了。至于为什么不考虑自研部署:一方面自己部署太折腾,另一方面算下来应该比直接买服务更贵。


    我调研了几个平台,发现一些问题:

    • 阿里

      • 视频口型替换:如果音频长于视频,会用“倒放-正放”交替模式扩展视频时长,结果就是看起来不太流畅。
      • 图生数字人:最长只有 20 秒,实在太短。
      • 图生唱演视频:只适合大头照,照片里一旦有手就容易错乱。
    • 客易云

      • API 对接门槛是 5000 起,前期投入太高。
      • 目前没看到能直接“图生数字人”的能力。
    • 蝉镜

      • 需要专业版及以上才能对接 API ,成本偏高。
      • 声音克隆有不少限制。
    • 字节即梦

      • 数字人 API 还未放开。

    参考截图:
    https://i.imgur.com/jIsf0dy.png


    想问下大家,有没有用过类似的数字人 API ?或者有没有性价比更高、效果更好的平台推荐?

    9 条回复    2025-09-05 18:59:22 +08:00
    RotkPPP
        1
    RotkPPP  
       3 天前
    几个大厂都试试呗,字节,百度,阿里的,总有适合你的
    jarl
        2
    jarl  
    OP
       3 天前
    @RotkPPP 字节的数字人 api 没开放,百度的 2D 小样本数字人定制(通用口型) 一次就 1000 元
    GaryLee
        3
    GaryLee  
       3 天前
    如果你是移动端的话,可以 github 上搜下 Duix-Mobile ,开源且可以端侧推理,我们已经在安卓设备上跑通整个流程了,就是定制数字人有点贵(没记错的应该是 9800 一个),还需要自己找人拍视频
    card123
        4
    card123  
       3 天前
    其实做这个挺多的 CC 视频好像也做吧?还有什么保利威视,应该都是做这一类的
    jarl
        5
    jarl  
    OP
       3 天前
    @GaryLee 感谢,看了一下,主要是针对数字人直播的,但是我们不需要直播,视频就行
    XinPingQiHe
        6
    XinPingQiHe  
       3 天前
    去年也曾到处寻找类似需求的实现,这些平台大多是针对终端用户的。还真没找到全流程支持的 API ,后来放弃了
    GaryLee
        7
    GaryLee  
       3 天前
    @jarl 他们主页有另外一个项目,就是用来生成视频的
    paceewang1
        8
    paceewang1  
       2 天前
    louiswanglol
        9
    louiswanglol  
       2 天前
    @jarl 需要视频合成 API 吗? https://chillin.online/zh_cn/render-api ,价格超低,有兴趣的话可以联系我微信 chillin-louis
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2714 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 14:48 · PVG 22:48 · LAX 07:48 · JFK 10:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.