V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
weitch
V2EX  ›  问与答

如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?

  •  
  •   weitch · 2020-10-01 19:25:00 +08:00 · 11068 次点击
    这是一个创建于 1510 天前的主题,其中的信息可能已经有所发展或是发生改变。
    孩子要求买天猫精灵,于是可以确定家里多了一个窃听器,每次我要说话都会下意识的把它的电源拔了(还是不放心,我都怀疑它会不会有备用电池),老婆说我多虑了。
    唉,很简单,“如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?”。

    也许,它现在对我毫无所图,又或许我值不得它对我有所图。
    但是我知道,它有能力做到对我有所图,当我知道只要它想要做坏事它就能做得到时,这让我感到十分不安。
    53 条回复    2020-10-02 19:17:53 +08:00
    wangxiaoaer
        1
    wangxiaoaer  
       2020-10-01 19:32:38 +08:00 via iPhone   ❤️ 2
    善用搜索,这都快成了日经问题。

    简单说 唤醒指令是本地持续实时监听,你说的是对的,但一般不用上传。唤醒后就不一定了。
    Nangle
        2
    Nangle  
       2020-10-01 19:33:15 +08:00
    也可以是 Siri 哈哈
    yujincheng08
        3
    yujincheng08  
       2020-10-01 19:35:45 +08:00
    手机上的 app 也可以实时监听(利用陀螺仪),建议没事手机就关机
    villivateur
        4
    villivateur  
       2020-10-01 19:36:13 +08:00 via Android   ❤️ 4
    你不如担心一下自己的手机,它了解你的信息可比一个天猫精灵多多了
    ThinkMan
        5
    ThinkMan  
       2020-10-01 19:54:23 +08:00 via iPhone   ❤️ 13
    AI 语音行业人士,天猫精灵用了我们的一些技术,过来聊两句。

    语音技术框架是:
    1 、mic 录音(本地,持续运行)
    2 、语音信号处理:语音降噪、Beaforming 等(本地,持续运行)
    3 、判断是否为唤醒信号(本地,持续运行)。若为唤醒醒号,执行第 4 步。若不是,继续循环 1,2,3 步。
    4 、开始上传音频,云端语音识别。且开始 VAD 检测,判断时候说话结束

    故:
    1 、在唤醒之前,是不会有任何语言数据上传的。
    2 、唤醒之后的语音数据,基本都有上传(主要用作云端 ASR )。但是这部分数据有没有被保存留作它用,就看厂家的良心了。
    Travers
        6
    Travers  
       2020-10-01 20:19:01 +08:00 via Android
    按照 @ThinkMan 的流程,其中最大的问题就是误触发。而 Apple 都因为聘用外包人员对误触发 Siri 语音进行分析而广遭诟病,对国内厂商实在无法给予更多信任。
    felixcode
        7
    felixcode  
       2020-10-01 20:21:03 +08:00 via Android
    iphone 的 siri 怎么办
    shequ2046
        8
    shequ2046  
       2020-10-01 20:33:26 +08:00
    @felixcode 可以关闭的。
    Phant0m
        9
    Phant0m  
       2020-10-01 20:37:37 +08:00 via iPhone   ❤️ 3
    iPhone 的 Siri 可以关闭,改用按键触发。
    重要的事情说三遍:不要信任国产软件,不要信任国产软件,不要信任国产软件。
    weitch
        10
    weitch  
    OP
       2020-10-01 20:39:40 +08:00
    @ThinkMan #5
    首先,“唤醒信号”并不只是叫一声“天猫精灵”吧。
    而且唤醒的方式也不一定是客户端自身,功能上可以做到从服务端发动唤醒指令。

    当然,从节能的角度上说,我也相信没有厂商会一直上传和保留所有人的语音数据。
    我担心的只是:当它们想要监听特定人群的时候,他们是完完全全有能力可以做得到的。
    jerryrib
        11
    jerryrib  
       2020-10-01 20:48:18 +08:00 via Android
    有没有上传不知道 参考李开复之前说过的一句话

    新工场董事长兼 CEO 李开复在 HICOOL 全球创业者峰会上表示,曾在早期帮助旷视科技公司找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量的人脸数据,并在随后的摸索过程中找到了几个有价值的商业化方向。
    Illusionary
        12
    Illusionary  
       2020-10-01 20:48:54 +08:00
    我这个天猫精灵偶尔会半夜自己说话,吓人,直接断电了
    lihua
        13
    lihua  
       2020-10-01 20:53:12 +08:00 via Android
    之前有新闻说播放催眠曲的时候,播放了鬼片的音乐。。。。
    crclz
        14
    crclz  
       2020-10-01 21:00:05 +08:00
    你说的每一句话它都会进入它的内存,但是不一定储存、上传。
    66450146
        15
    66450146  
       2020-10-01 21:08:00 +08:00
    纯技术上来说,手机就有足够的硬件能力来监听你了,而且还知道监听的时候你在哪里
    ioriwong
        16
    ioriwong  
       2020-10-01 21:11:51 +08:00 via iPhone
    @ThinkMan 就怕除了“天猫精灵”,还有别的触发词,特别是政治词语
    TypeError
        17
    TypeError  
       2020-10-01 21:18:59 +08:00 via Android
    隐私无小事,现在是实名制时代,你不能确认它联网上传后数据经过了几手(比如隐私协议中有什么数据归 xx 关 9 公司所有,对合作伙伴开放)

    一旦被精准定位了,那就要小心诈骗盗刷贷款了
    hoyixi
        18
    hoyixi  
       2020-10-01 21:19:58 +08:00
    买个这么个玩意放家里,我是不能理解
    tetora
        19
    tetora  
       2020-10-01 21:20:58 +08:00 via Android
    @ioriwong 过于小众我觉得不会投入资金搞这个
    weitch
        20
    weitch  
    OP
       2020-10-01 21:22:37 +08:00
    @hoyixi #18
    没办法,小孩耍赖要买。
    可能真如李彦宏说的“隐私换便利吧”。
    Takuron
        21
    Takuron  
       2020-10-01 21:24:59 +08:00
    说到底还是个信任问题,技术人员也不用喊冤了
    我是不会买的
    hzfyjgw
        22
    hzfyjgw  
       2020-10-01 21:32:26 +08:00
    adguard home 能否拦截特定域名
    FFLY
        23
    FFLY  
       2020-10-01 22:00:17 +08:00   ❤️ 3
    未来的世界语音交互是大势所趋,天天被害妄想何必呢?又不是搞谍战,我是不觉得商业产品持续监控上传有任何的价值。凡事都有成本,对每一个用户持续监控,除非哪天实现本地化识别分析。只要是云端识别的,你那些无聊的家长里短毫无价值,从商业角度说,毫无性价比,资本家又不是傻子。算力和带宽都是要钱的!
    ericwood067
        24
    ericwood067  
       2020-10-01 22:24:53 +08:00
    曾经公司给每个员工都发了一个自己公司的智能音箱,用了两天突然感觉有点不太对,就耗光了电再也没开过机了。
    当然,大概率不会有问题,但是公司发的还是有点害怕。我觉得我之所以跟楼主一样有这种想法,可能跟中国人受到阴谋论的教育太多了有关系😏
    ashong
        25
    ashong  
       2020-10-01 22:28:58 +08:00
    肯定守听啊, 不然怎么知道你叫它
    natashahollyz
        26
    natashahollyz  
       2020-10-02 00:58:40 +08:00 via iPhone
    害怕就不用
    这东西有什么用吗?
    futandrew
        27
    futandrew  
       2020-10-02 01:22:42 +08:00 via iPhone
    @Phant0m 就信任外国软件和公司咯?
    NilChan
        28
    NilChan  
       2020-10-02 01:52:07 +08:00 via Android   ❤️ 1
    @futandrew 这也能扛?不能一起不信任吗?
    philipjf
        29
    philipjf  
       2020-10-02 03:52:52 +08:00 via iPhone
    @FFLY 唤醒信号就是本地识别的,敏感词也可以是唤醒信号
    flyz
        30
    flyz  
       2020-10-02 04:05:32 +08:00 via Android
    @ioriwong 怕什么,它敢拿出来定罪么。
    如果商业公司承认,那以后就别卖产品了。
    如果商业公司不承认,法院拿什么当证据定罪?
    当然非要定个寻恤滋事罪,这个不需要什么证据。
    LxExExl
        31
    LxExExl  
       2020-10-02 06:19:41 +08:00   ❤️ 1
    @Travers #6 我不是 ThinkMan 家 /Apple 的,不过也在做相关的。

    为了解决 ASR 的准确度,人工打标是必须的。不过外包人员会签保密协议,给外包听的 audio clip 也是只有语音,没有其他用于识别身份的信息。ML 的 labeling 总是需要打标,只能寄希望于厂家过程合规,PM/程序员重视隐私数据处理了。
    junyee
        32
    junyee  
       2020-10-02 07:08:59 +08:00 via iPhone   ❤️ 1
    阿里最大的价值就是数据,精灵可以名正言顺地收集你的语音数据,你真的期望它会安份守己?

    臭鱼后台监听对话精准投放广告已经很恶心了!
    junyee
        33
    junyee  
       2020-10-02 07:12:16 +08:00 via iPhone
    @futandrew
    我的看法是国内 App 一概不能信任,野鸡 app 是真 小人,大厂则是伪君子,国外即使好点但也要存疑。
    zitengdu
        34
    zitengdu  
       2020-10-02 07:40:06 +08:00
    五楼说的没毛病。
    我想再补充下,云端语音引擎的工作需要对已有的标注数据训练声学模型,这种数据通常 1 到 10 万小时不等。云端的音频保存应该很多都是用作提升识别引擎性能,因为单买经授权的语音标注数据很贵,至于各厂商有没有这么做,请看看隐私协议,就拿我手头的小爱音箱 app 举例,隐私协议明确写了用作语音唤醒识别模型的优化。
    redtea
        35
    redtea  
       2020-10-02 07:47:23 +08:00 via iPhone
    用人不疑,疑人不用。
    XsterreX
        36
    XsterreX  
       2020-10-02 08:15:44 +08:00 via iPad
    Google Amazon Apple 以及国内一票上传肯定是上传的
    但是,上传后内容是否对自己造成后果影响

    我还是选择海外三家,我一个国人他们拿我数据我也不慌啊
    国内上传了,鬼知道会发生什么,万一来个秋后算账吃不消
    ifxo
        37
    ifxo  
       2020-10-02 08:34:20 +08:00   ❤️ 1
    你说的每句话都实时转文字上传服务器,傻冒才上传音频
    ftu
        38
    ftu  
       2020-10-02 08:37:48 +08:00   ❤️ 5
    在这个论坛:Made in China 是原罪,懂王表示喜闻乐见。
    sugarsalt
        39
    sugarsalt  
       2020-10-02 09:25:27 +08:00
    @ftu #38 大帽子扣起来~
    0v0kun
        40
    0v0kun  
       2020-10-02 09:29:57 +08:00
    商业公司的东西都不值得信任
    noparking188
        41
    noparking188  
       2020-10-02 10:33:09 +08:00
    @ftu 不过大家自己基本也都是 made in china,希望不要想不开
    cmdOptionKana
        42
    cmdOptionKana  
       2020-10-02 11:31:47 +08:00 via Android
    @weitch 你的第一个问题是 “如果天猫精灵不时实的窃听,那它如何知道你在叫“天猫精灵”?”

    上面已经有专业人士回答,唤醒完全可以本地做,不需要上传。

    你的第二个问题是 “当我知道只要它想要做坏事它就能做得到时,这让我感到十分不安”

    这个想法很正常,有一部分人选择 iPhone 不选择安卓也有这个因素。

    但从理智上看,也没必要过分担忧,
    FFLY
        43
    FFLY  
       2020-10-02 12:00:45 +08:00
    @philipjf 是不是对智能音箱本身的性能有什么误解?你觉得他可以本地化多少关键词?
    @ifxo 你就是傻冒呀! V2 现在综合水平越来越低,完全不懂技术的喷子到处都是。
    vfxx
        44
    vfxx  
       2020-10-02 12:08:50 +08:00
    我实在没想到我有什么东西值得被偷听。

    信得过就买,信不过就别买,这有啥好纠结的,就是个哄孩子的玩具而已。
    so898
        45
    so898  
       2020-10-02 12:10:09 +08:00
    楼主家庭的问题,楼主并做不了主,家庭地位堪忧啊
    weitch
        46
    weitch  
    OP
       2020-10-02 13:16:20 +08:00
    @so898 #45
    骚年,这都能让你看出我的苦衷,可以啊,你可以当侦探了!
    thetbw
        47
    thetbw  
       2020-10-02 16:01:56 +08:00 via Android
    @ioriwong 这个就恐怖了,精准喝茶
    HankAviator
        48
    HankAviator  
       2020-10-02 16:11:45 +08:00
    不响应语音的就不会窃听了吗?所有带麦克风的理论上都可以一直“窃听”
    各种电器,关机就是真的关机了吗?说不定就是不给显示屏加电,不响应开机外的指令而已?
    拔了电源,说不定有内置电池呢?有电池的,拔了电池只是触发假关机事件呢?
    看得见的有电器,看不见的会不会搬来之前就装了窃听设备?
    就算不用任何电器,隔壁邻居会不会总是趴着墙听你说话?
    (狗头)
    ScepterZ
        49
    ScepterZ  
       2020-10-02 16:18:04 +08:00
    唤醒是离线的,唤醒之后要做精确的 asr 才需要上传音频
    一直上传吃不消的
    mightofcode
        50
    mightofcode  
       2020-10-02 16:26:15 +08:00
    中国互联网企业没有隐私可言
    zhouweiluan
        51
    zhouweiluan  
       2020-10-02 18:13:11 +08:00
    楼主这样生活得多累。。。。
    guansixu
        52
    guansixu  
       2020-10-02 18:43:33 +08:00
    歪个楼,“时实” 应该是 “实时”
    franc3567
        53
    franc3567  
       2020-10-02 19:17:53 +08:00
    国产软件。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3147 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 13:39 · PVG 21:39 · LAX 05:39 · JFK 08:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.