V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  younger027  ›  全部回复第 1 页 / 共 2 页
回复总数  25
1  2  
@helone 嗯嗯,明白啦,感谢。我去咨询下细节
@maggch97 这种方案有在作,还是想尝试下垂类模型这块。毕竟我们自己的数据还是多的。希望有自己的壁垒
@frandy 明白,除了模型产出的成本,还得要维护更新,应该分两个阶段的成本统计。感谢回复。
@xmumiffy 明白,直接就驻场了是吧。那费用呢,比如说半年内要个可用的模型,应该报价多少呢?您了解嘛
@chy2v 能充当一个 AI 教辅的职责,下面那个哥们说的,口语打分,纠音,实时陪练,写作批改这些都希望有。是不是又得在这些里面细分更垂类的模型呢。专家小模型?
@KenThompson1729 语言教学,预算不限,1kw rmb 左右都可以接受。这个价格只是随口一报,如果效果好,预算也可以提
187 天前
回复了 memechs 创建的主题 程序员 分布式系统学习路线求助
没太明白你的需求啊。从标题看你需要学习分布式系统的理论和实践,那你看看这本书《数据密集型应用系统设计》,然后将这些理论知识引用到这些组件中(zookeeper 、thrift 、dubbo)去体会就好啦。
但是看你的具体描述,好像得先胜任工作吧。那就去学 java ,spring 这些。找点小项目自己跑跑看,然后写一个小模块,完成个增删改查啥的。把那些组件接入进来,先用起来呗。
@loveaeen 哈哈哈 转人工实在是没绷住
320 天前
回复了 iAjue 创建的主题 程序员 我的个人相册,想收获点小星星
真刑啊
@Raynard 为什么不推荐 ocbc 啊 大佬
听博士的。
战略性插眼,学习方案
354 天前
回复了 EagerTo 创建的主题 程序员 今天是 1024。
节日快乐
2024-08-16 17:00:50 +08:00
回复了 spotsung 创建的主题 程序员 关于影视二创和搬运的
@spotsung 就这一整套逻辑来说,目前模型+python 可以完成(已经实验过),成本不会很高。但是有几个问题哈。
1.提出的音频质量如何,这个很影响转文字的质量,据我实验中文视频的错误率比英文会高很多,比如中文名,多音字。所以你可能需要些技术,降噪?去回音?
2.大模型的翻译(中--》英,韩,日)质量都不高,google 的付费翻译接口,也只是个平均值的效果。
3.目前 tts 的效果确实不错,声音效果不错。chattts,cosyvoice,gptsovits 都可以试试看。
4.我尝试过音轨合并,然后合成到原来的视频上,这一部很难,效果不好。主要是 1.换语言后,句子发音长短不一样。2.整体合并的效果很不好,听起来很别扭。(我使用 python 包搞的,如果你的效果好的话,也可以分享下。)

基本我经历的就这么几个问题,你可以试试看。毕竟不动手,啥问题也没有。动手了,问题和我也不一定一样。
2024-08-14 17:47:46 +08:00
回复了 spotsung 创建的主题 程序员 关于影视二创和搬运的
@vacuitym 音频转文字吗?开源的模型有试过吗?
2024-08-09 19:18:07 +08:00
回复了 awanganddong 创建的主题 Go 编程语言 golang 依赖循环的问题。
人家问问题,你会就解答,不会就闭嘴。最烦 10 楼的,讲了一堆 pi 话,来显示自己来了?
直接 cf R2 走起就好了 免费
1  2  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   905 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 26ms · UTC 20:53 · PVG 04:53 · LAX 13:53 · JFK 16:53
♥ Do have faith in what you're doing.