V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
znwindy
V2EX  ›  程序员

求问有什么字幕输出语音方案(发音时间须对准字幕时间戳)?

  •  
  •   znwindy · 2022-04-15 10:32:55 +08:00 · 1068 次点击
    这是一个创建于 979 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有个需求是从字幕文件转真人语音,我看微软百度 Amazon 都有这种服务,但是有个痛点是字幕是有时间线的,需要时间对齐,不然会出现音画不同步的情况,求问下有没有做过的朋友。

    2 00:00:06,144 --> 00:00:08,448 Seven module one we covered

    3 00:00:08,960 --> 00:00:11,520 The overview of the whole strategy

    4 条回复    2022-04-15 15:38:31 +08:00
    msg7086
        1
    msg7086  
       2022-04-15 10:58:50 +08:00
    点不算很痛吧,拿到语音以后取出长度,然后 pad 到时间轴长度,再拼起来就行了呗。
    znwindy
        2
    znwindy  
    OP
       2022-04-15 11:00:00 +08:00
    @msg7086 #1 是的,我后来想了想的确就是如此,按照字幕长度把每条语音输出再粘合起来,感谢
    hgert
        3
    hgert  
       2022-04-15 14:48:04 +08:00
    有个基本没用的方案 闲着蛋疼可以一试:字幕文件——音频文件,然后扔进视频编辑软件自动生成字幕打上去 不过这样一来就是硬字幕了 成品修改有点麻烦而且任务嘴型很难对的上 还是 1L 的方案好点
    znwindy
        4
    znwindy  
    OP
       2022-04-15 15:38:31 +08:00
    @hgert #3 了解,因为是大规模的,必须用代码做了,感谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4952 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 03:55 · PVG 11:55 · LAX 19:55 · JFK 22:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.