V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Livid
V2EX  ›  OpenAI

目前(2023 年 11 月 19 日)有任何基于 OpenAI 的可以语音聊天的智能音箱么?

  •  
  •   Livid · 2023-11-19 20:45:26 +08:00 · 5384 次点击
    这是一个创建于 398 天前的主题,其中的信息可能已经有所发展或是发生改变。

    或者是否有什么比较好搞的 DIY 方案?

    21 条回复    2023-11-30 10:59:33 +08:00
    renmu
        1
    renmu  
       2023-11-19 20:54:35 +08:00 via Android   ❤️ 1
    Baymaxbowen
        2
    Baymaxbowen  
       2023-11-19 20:55:55 +08:00   ❤️ 1
    参考火火兔,https://twitter.com/lewangx
    x86
        3
    x86  
       2023-11-19 20:56:43 +08:00   ❤️ 2
    tool2d
        4
    tool2d  
       2023-11-19 20:57:04 +08:00   ❤️ 1
    我也想要一个,可惜没找到,最终用安卓电视遥控器的语音输入功能对接了一下。

    对于国内孩子来说,买个天猫精灵也能凑合一下,用的是阿里巴巴的 AI 大模型。
    wujiang007
        5
    wujiang007  
       2023-11-19 23:05:58 +08:00
    我打开开发一个,关键是有人愿意付费么?
    daiv
        6
    daiv  
       2023-11-19 23:34:05 +08:00
    @wujiang007 愿意
    wujiang007
        7
    wujiang007  
       2023-11-19 23:47:43 +08:00
    https://www.right.com.cn/forum/thread-4091888-1-1.html 这个是我之前开发的,可以基于这个改个 OpenAI 的版本出来,如果搞个 GPT 的版本按月付费,你们觉得多少合适?
    wujiang007
        8
    wujiang007  
       2023-11-19 23:52:45 +08:00
    https://chat.xiaozeai.com/ 这个也是我开发的,最近还在试着用 whisper+tts-1 api 开发语音模式,结合一下就行。
    a30968932
        9
    a30968932  
       2023-11-20 10:34:42 +08:00
    小爱同学大模型内测了。等小爱音响把
    meowth
        10
    meowth  
       2023-11-20 14:50:27 +08:00
    https://aircode.cool/hpwdi7n719 这个可以参考一下,让 Siri 链接 chatgpt 的,可以配合 homepod
    customer
        11
    customer  
       2023-11-26 21:59:47 +08:00
    火火兔这种太讨巧了,手里持设备做这个有先天优势。前几个月自己手撸了一套方案,发现麦克风是最大的坑,非常好奇商业产品要怎么解决小型麦克风芯片的收音问题。目前我买过的商业产品都是饱和式响应,随便说个差不多的就回答,甚至在对话过程中都可能唤醒。经常发现下班回家机器是点亮的,让人直起鸡皮疙瘩。
    ghwolf007
        12
    ghwolf007  
       2023-11-28 10:27:20 +08:00
    @wujiang007 #7 这个后台是 gpt 吗 可以自建服务器吗
    wujiang007
        13
    wujiang007  
       2023-11-28 14:39:09 +08:00
    @ghwolf007 #12 是 gpt ,啥是自建服务器?
    ghwolf007
        14
    ghwolf007  
       2023-11-28 14:51:55 +08:00
    @wujiang007 #13 myUnisound 为 bandaot (半岛 t )基于官方原版再参考了飞大的免绑定与网络劫持代码重写并自建服务器提供后端服务,请大家低调使用!
    这个是啥啊 可以配置自己的 gpt api key 吗
    zariba
        15
    zariba  
       2023-11-28 15:16:03 +08:00
    要是能应用 GPTs + 实时 TTS 就好了,体验肯定大幅度提升
    wujiang007
        16
    wujiang007  
       2023-11-28 15:17:07 +08:00
    @zariba #15 理论上可以搞,就是成本不低
    wujiang007
        17
    wujiang007  
       2023-11-28 15:18:01 +08:00
    @zariba #15 GPTs 的接口也搞定了
    israinbow
        18
    israinbow  
       2023-11-28 17:55:21 +08:00
    @wujiang007 #16 我用 rk3588 做过类 llama + WaveRNN 方案的牛头不对马嘴 bot, 还是蛮有意思的; 做成离线方案的智能设备得上 jetson, 用 gpt 网络接口成本也不会很高啊.
    wujiang007
        19
    wujiang007  
       2023-11-28 18:32:30 +08:00
    @israinbow #18 只是相对来说,对于想白嫖的人来说,10 块他都觉得贵,对于愿意掏钱的人来说,每月 100 也能接受,毕竟 GPT plus 就得 20 刀一个月,GPT4 接口也不便宜。我说的贵是 GPTs 的成本。
    amon
        20
    amon  
       2023-11-28 18:40:36 +08:00
    插一句,小爱音箱这种喊一嗓子回一句的形式,真的很落后。
    didikee
        21
    didikee  
       2023-11-30 10:59:33 +08:00
    @amon 落后不要紧,关键是现在老让你充钱。你不充钱它就天天说,问啥他都问你要不要开个会员啊,真是烦死
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2762 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 09:39 · PVG 17:39 · LAX 01:39 · JFK 04:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.