作为一个标题党,分享下近期做的小工具基于 Meta 开源模型 SeamlessM4T 的翻译 APP Gitee
主要就是本地部署 SeamlessM4T 模型用 Flask 提供翻译接口,随便搞了个 Flutter 使用这个接口进行语音/文本转译,按模型能力,基本能实现对话后直接翻译。
如果研究下麦克风的音频输入流和耳麦的音频输出流,要是能做到收听到外部说话-->监听分段录音-->翻译转录-->替换耳麦输出,就能实现人手一个翻译机了吧。那回到这个问题:翻译大模型出来了还需要苦学语言吗?
1
threeEggs123 2023-12-04 12:46:04 +08:00 via Android
楼主好厉害,前几天看到公众号写了关于 meta 的 seamless 的介绍,今天你就做出来了。请问,我看你的 github 写了需要下载模型,这个是本地模型接收语音流,都不要调用 meta 的翻译 api?
|
2
sakura6264 2023-12-04 13:01:03 +08:00 2
只要大模型还没集成到你大脑就是需要学的
|
3
isSamle OP @threeEggs123 前几天写的,现在好像模型有 V2 了,对本地处理,不用调用 meta 的接口,自己下了模型部署在本地就行
|
4
isSamle OP @sakura6264 等脑机接口了是吧
|
5
wwk 2023-12-04 13:49:40 +08:00
要不要苦学看个人需求,但学语言肯定还是有价值的。
翻译机不可能任何场景都戴着比如床上、或荒岛求生啥的。另外认真来说语言还承载文化和历史,例如国人看到“明月几时有,把酒问青天”,脑海大多是能构建出相关的意境上下文的。 |
6
Masoud2023 2023-12-04 14:58:47 +08:00
你觉得呢?动动脑子分析下?
当标题党现在都能理直气壮了? |
8
isSamle OP @Masoud2023 这叫开诚布公
|
9
zagfai 2023-12-04 16:49:57 +08:00
@sakura6264 也不是啊,能做到入耳式实时翻译,延迟个两三秒的,能解决 99%的问题了
|
10
SkywalkerJi 2023-12-04 18:21:10 +08:00 via Android
使用大模型 ai 和现在的翻译笔相比有什么决定性优势?
|
11
shendaowu 2023-12-04 19:11:34 +08:00
我记得懂一门外语的人好像在某种任务上比只会一种语言的人更厉害。我只记得挺意外也挺有用的,具体是什么我忘了。搜“双语 好处”能搜到一些东西。不过我看了几个,感觉都不是我印象中的那个东西。
另外苦学对绝大多数人来说基本都是难以坚持的,也许找点学习方法碰碰运气更好一些。我最近经常听 Huberman Lab 的播客,好像有种一直在学英语的幻觉,但是一点都不痛苦。我觉得应该不是存粹的幻觉,应该还是稍微有点用的。关键是我非常喜欢这个播客的内容。某期关于达成目标的音频我听了大概几十遍了也没腻。 |
12
lin7946 2023-12-05 11:22:08 +08:00
日常使用也不需要大模型了,本来就有同步翻译。但是无论是哪一种语言到某个程度,都会有一个“只可意会不可言传”的门槛,如同#5 所说,关乎到了文化和历史了。
|
13
abersheeran 2023-12-05 16:22:19 +08:00
@shendaowu 这个结论我也看过。我觉得是颠果为因了。不是因为学了新语言变聪明,是因为本来就聪明才能学会新语言。
|
14
shendaowu 2023-12-05 18:26:50 +08:00
@abersheeran #13 我觉得我看到的应该是双语学习能提高创造力。刚才我问了一下 ChatGPT ,它提到了创造力。另外在心理学领域好像有不少成对的互为因果的变量,让我蒙的话我蒙互为因果。当然可能某一个变量对另一个变量的影响更大。
|
15
yyxingkong 2023-12-06 18:43:47 +08:00
小白一枚,有没有 gpt 的翻译效果好?
|
16
isSamle OP @yyxingkong 没有,主要是方便,用 gpt 的话我也试了,Whisper 识别,gpt 翻译,再文本转语音,设备性能不行太慢了
|
17
threeEggs123 2023-12-07 20:21:20 +08:00 via Android
@isSamle 楼主方便留个联系方式吗?付费请教一些问题
|