V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Roykira
V2EX  ›  macOS

macOS 的搜狗输入法到底安不安全?至少从《隐私政策》来看,要比 Windows 的搜狗「克制」一些

  •  1
     
  •   Roykira · 2022-08-10 20:51:17 +08:00 · 5304 次点击
    这是一个创建于 842 天前的主题,其中的信息可能已经有所发展或是发生改变。

    每过一段时间就会有「月经贴」会询问 macOS 系统下什么输入法最好用,一些人或许还带着 Windows 系统的记忆老觉得搜狗全是广告,但用过搜狗的人也知道,macOS 端的搜狗确实没有广告。因为此前有朋友跟我纠结了很久要不要在 macOS 上使用搜狗输入法,其实这个东西就是个习惯问题,但既然他问到了隐私政策的问题,那我就从法律文书的角度来分析一下搜狗输入法到底收集了用户的什么隐私。

    分析 Windows (以下称为 W 版)与 macOS (以下称为 M 版)系统下搜狗输入法的隐私政策。

    一些前提条件

    • 隐私政策分析时的最新版本:
      • W 版:12.2.0.6275
      • M 版:6.9.0.8922
    • 是否登录账号:双版本均登录 Gmail 邮箱注册的搜狗账号,未绑定手机号,目前能正常使用。
      • 结论:搜狗输入法的登录账号是可以使用不含用户敏感信息的邮箱注册的,而 Gmail 本身可以实现不需要实名注册(可以不绑定电话号码),所以搜狗输入法是可以采用非个人邮箱注册使用的。
    • 是否开启了云输入等上传功能:双本均全部开启。双版本均未进行网络接入、上传限制。
    • 这个隐私政策的分析并不是分析全部内容,如有缺失请多指教。

    W 版与 M 版搜狗输入法在《隐私政策》上的不同

    1. W 版搜狗输入法到底会收集哪些「敏感信息」?
      1. 从 W 版的《隐私政策》来看,搜狗输入确实会收集特别多的内容,但是他并没有明确说明这些敏感信息是如何收集、计算而来的。
      2. W 版中,将个人信息及个人敏感信息定义为:个人信息包括 1 )姓名、出生日期、住址、电话、电子邮件等个人基本资料; 2 )身份证、护照、驾驶证、工作证、社保证、居住证等个人身份信息; 3 )基因、指纹、声纹、掌纹、面部识别特征等个人生物识别信息; 4 )个人信息账号、IP 地址、个人数字证书等网络身份标识信息; 4 )个人健康生理信息; 5 )职业、职位、工作单位、学历、工作经历、成绩单等个人教育工作信息; 6 )银行账号、口令、存款信息、房产信息、信贷信息、征信信息、交易和消费记录、流水记录、虚拟财产等个人财产信息; 7 )通信记录和内容、短信、彩信、电子邮件等个人通信信息; 8 )通讯录、好友列表、群列表、电子邮件地址列表等联系人信息; 9 )网络浏览记录、软件使用记录、点击记录、收藏列表等个人上网操作记录信息; 10 )硬件序列号、软件列表、设备 MAC 地址、唯一设备识别码等设备信息; 11 )定位信息、行踪轨迹、住宿信息、经纬度等个人位置信息; 12 )婚史、宗教信仰、性取向、未公开的违法犯罪记录等其他信息。
      3. 上述敏感信息是如何提供并上传的?
        1. 「用户主动提供」,在《隐私政策》中主要把它「归功」与用户使用不限于 QQ 、微信、邮箱、手机号注册等,注册并登录搜狗输入法,也就是说,基本上与实名制挂钩的信息都是在这个环节被搜狗通过「同意打钩否则就不能用软件」的方式获取到的。
        2. 「您在使用我们的产品和服务时上传的信息」,这一条就比较有趣,因为在第一章第二款的 1.2 这个部分,里面有一句并没有加粗的话,看上去很简单,但是包含了巨大的信息量:您在使用语音转写、翻译功能时选择在云端存储的待转写、待翻译及转写、翻译后的文本;其他您在使用我们产品和服务时上传的信息,以具体产品或服务的隐私政策为准。前述信息收集的目的是为对应的具体功能的实现,如您不提供相关信息的,对应功能可能无法实现。
        3. 也就是说,大家最关心的「使用输入法时键入内容被记录并上传」的隐私问题,从通篇的《隐私政策》里,我只能从这句比较模糊的不起眼的条款中看出。
    2. M 版搜狗输入法到底会收集哪些「敏感信息」?
      1. 「 M 版明确划分了可能被上传服务器的内容」:从 M 版的《隐私政策》来看,搜狗并未像 W 版的《隐私政策》对敏感信息做出了大段定义,而是拟出了一个明确的用户信息收集的清单。 1
      2. 基本的邮箱、电话等这些信息不用多说,如果要使用词库同步的功能,就必须要登录账号。所以我在一开始做了那个「实验」,即使用一个未与自己任何个人信息挂钩的 Gmail 注册账号并登录的方法是可行的。所以目前来讲,M 版的搜狗也能收集到的是一个 Gmail 邮箱。
      3. 根据 M 版《隐私政策》的 1.1.1 款所示:当您通过搜狗通行证登录搜狗输入法 Mac 版账号,您需要向我们提供您的用户名、邮箱或手机号以完成注册及登录。您也可以选择使用第三方账号登录,经过您的授权同意,第三方账号平台可能会向我们提供您的账户昵称、头像、OpenID 。以及如您不登录搜狗输入法 Mac 版账号,我们不会收集您的上述个人信息,但与登录相关的功能将无法使用。可以看出,M 版的用户信息收集相对要「克制」一点。
      4. 「哪些内容会被上传?」值得欣慰的是,M 版的搜狗在《清单》中明确表示:文本信息、剪切板内容、图像信息、通讯录中的姓名、手机号是不上传服务器的。
      5. 同时在《隐私政策》的 1.1.2 至 1.1.4 对上述不上传服务器的内容有具体解释:
        1. 当您使用语音输入功能时,您需要向我们提供您的语音信息,以实现语音转写的输入功能。语音输入完成后我们不会存储您的语音信息。
        2. 在您使用打字功能、剪切板功能、截图功能时,我们会在本地读取您键入、复制剪切的字符或截取的图像信息,以便完成文字和截图输入上屏的基本服务功能,请您知悉,前述您输入的内容不会上传到云端。
        3. 为了及时解决您的意见反馈、投诉或咨询本产品的相关问题,您需要向我们提供真实的联系方式,以及问题相关的证明材料(包括图片、视频或文本信息)。此外,请您知悉,系统可能会记录您与客服之间的沟通记录、处理方案及结果。如您不提供上述信息,我们可能无法核验身份、定位问题并向您及时反馈。
        4. 为了提高您输入日常联系人信息的便捷性以及输入内容的准确性,经您同意打开通讯录权限后,我们会在本地读取您的通讯录信息中的姓名、手机号,并形成本地词库,但我们不会收集和上传您的通讯录内容。
      6. 或许仍有搜狗拥有最终解释权的灰色地带。在《隐私政策》 1.2.3 款中,当您使用搜狗输入法 Mac 版产品和服务时,为了通过分析统计数据以提高产品和服务质量,推出对用户有帮助的创新功能和服务,我们可能会收集并记录您对搜狗输入法 Mac 版各项功能的使用情况,以便我们在分析数据后,提升产品和服务的使用体验。这里指的「各项功能」并没有明确写明是否是云词库、本地词库同步等功能。但按照文书内部逻辑,1.1.3 款中明确提到了不会对「键入」进行上传,1.2.3 中的功能应当不包含软件在键入时触发的云输入、联想、调频功能。
    3. 「征得同意的例外」,这是《隐私政策》中必须要出现的一部分,也拥有最高抗辩权。关于这个格式条款的讨论,我在自己的博客有写到过。这里就不再赘述。

    结论

    1. 「 W 版搜狗输入法比 M 版搜狗输入法收集的用户信息可能更多」
      • 这个结论显而易见,我相信这也是很多人选择使用苹果生态其中一个原因,W 版把用户隐私的定义写得如此详细,大概也是用了一个「最大值」来涵盖自己目前和将来可能会的收集范围。
      • M 版的搜狗输入法的《搜狗输入法 Mac 个人信息收集清单》所示,M 版在用户信息的收集方面确实要克制很多,并且明确表明他们对用户键入时的相关信息并未进行上传服务器的行为。
    2. 可能你会说:「《隐私政策》不过是单方面的说法,现实是不是这样执行的不太好说」
      • 当然,包括我在内,我对国产软件的「隐私保护」并没有太多信心,我以前也在互联网公司呆过,负责过审《隐私政策》时,当然知道这些《隐私政策》其实都是一个版本的格式条款。但既然 M 版的《隐私政策》不同于 W 版,那本身也可以说明搜狗输入法在这两个操作系统的产品,确实是采用不同的隐私政策标准。
      • 既然是契约,那就拥有法律效力。如果 M 版的输入法,确实对用户键入内容时的云输入、联想、调频进行了上传行为,那《隐私政策》和《清单》本身作为的契约文书,是可以作为搜狗违约的证据。
    3. 是否推荐搜狗输入法?仍然不太推荐
      • 说实话,我仍然不推荐,就算我平时会在特定场景(比如写博客)切换到搜狗输入法进行使用,但平时大部分时间我仍然使用 macOS 自带的输入法——因为自带输入法的词库简直太拉胯了,而且 macOS 和 iOS 端的词库是不同步的!对于文字工作者,词库和词频确实是提高效率最为关键的因素之一。
        • 我的解决方案:安装搜狗输入法,但通过 Input Source Pro 设置它仅在我的博客地址下,或 notion 应用程序内使用搜狗输入法,其他地方仍继续自动切换回系统自带输入法使用。
      • 搜狗输入法至今仍未解决一个历史问题:即大量读写硬盘。轻则 100mb ,动则 50GB 以上,具体的原因由于我并不是技术出身,没办法越俎代庖进行专业分析。今天仅能从「法律」的角度来解读一下《隐私政策》本身。
      • 我也推荐 Rime ,对于爱搞机的朋友,这款输入法确实能做被调教得非常棒。但由于我作为文字工作者,需要大量的输入和词频的智能化调整,所以我确实调教不来 Rime 。虽然没用,但是还是推荐大家。
    4. 其他需要注意之点。
      • M 版的词库(包含快捷短语)、输入统计等,并无法同步至 W 版的搜狗输入法,或许能够证明键入内容部分与 W 版是不相通的。
      • 个人词库仍然可以同步并上传云端的,因为可以和 iOS 端进行同步使用。如果登录账号无法追踪到手机号,那这些词库本身是无法对应到具体身份信息的。在《隐私协议》 1.2.1 款中提到:我们不会将该等信息与您的个人身份信息进行匹配,除本政策另有明确约定外,我们也不会将您的设备信息提供给任何第三方。但「另有明确约定」其实就是「征得同意的例外」这一条最高尊则。所以词库本身,并不能说是 100%安全的。大家也知道,词库的内容本身也可以推算出一个人的性别、性向、婚史、宗教信仰等等。
        • 解决方案:不登录使用确实是一个好方法,但换电脑之后词库无法同步,跟 macOS 自带输入法是一样的「酸爽配方」。
      • 本内容仅对搜狗输入法的《隐私政策》通过法律视角进行分析,过程中并无「拉踩」「反对」「对立」等挑拨行为,也再次明确声明我不对搜狗输入法作出推荐。
    第 1 条附言  ·  2022-08-18 08:49:49 +08:00
    好了,帖子可以结帖了。
    《互联网信息服务算法推荐管理规定》发布了,算法被规范了,输入法的算法是最容易出卖隐私的,建议大家不要用国产输入法了。
    29 条回复    2022-08-18 08:49:58 +08:00
    Twnysta
        1
    Twnysta  
       2022-08-10 21:00:26 +08:00
    文本信息不传,那信息的 hash 会不会传呢?
    neochen13
        2
    neochen13  
       2022-08-10 21:18:54 +08:00
    MacOS 没有一个很好的输入法,痛苦
    janus77
        3
    janus77  
       2022-08-10 21:44:19 +08:00
    无所谓,windows 我用破解版
    至于云词库的上传情况,这块控制不了,爱咋咋地吧
    Lindp
        4
    Lindp  
       2022-08-10 22:16:57 +08:00
    Mac 的确是没有一个能打遍天下的输入法,现在也只能是原生输入法用着了,好在用的时候足够长原生输入法也可以适应习惯。
    B3UzMhCd3dDvVVLa
        5
    B3UzMhCd3dDvVVLa  
       2022-08-10 22:28:51 +08:00
    我就是不登录用着搜狗的,偶尔会导出词库,换机的话再导进来
    nonone
        6
    nonone  
       2022-08-10 22:39:07 +08:00
    算了 还是自带的吧
    dcsuibian
        7
    dcsuibian  
       2022-08-10 22:40:42 +08:00
    不登录用搜狗+1 ,搜狗有明文传输隐私数据的前科
    但其它的输入法真的没有他好用
    estk
        8
    estk  
       2022-08-10 23:15:40 +08:00 via Android
    谷歌安卓输入法也不好用
    bs10081
        9
    bs10081  
       2022-08-11 06:46:05 +08:00
    結論,我用自己的 Rime 配置( 打字不會閃,詞庫養好以後,非常的順手。

    https://github.com/bs10081/Rime-Cx330
    dreamramon
        10
    dreamramon  
       2022-08-11 08:02:27 +08:00
    搜狗会上传的,不用洗了,还是老老实实用原生的吧。。。
    Leonard
        11
    Leonard  
       2022-08-11 09:11:19 +08:00
    之前公司发的 Mac 上有搜狗输入法,用了几天老提示我什么斗图功能,我又不斗图,烦死,卸载
    xingyuc
        12
    xingyuc  
       2022-08-11 09:51:19 +08:00
    他说不上传就不上传?火绒还经常扒他们源码……
    Roykira
        13
    Roykira  
    OP
       2022-08-11 09:59:18 +08:00
    @Twnysta 这个就不是太清楚了,因为我仅仅是从《隐私政策》的条款来分析的,如果它里面没有提别提到这个概念,那说明这个本身也是他们不打算明确写入《隐私政策》的。
    astkaasa
        14
    astkaasa  
       2022-08-11 10:00:38 +08:00
    @bs10081 我也抄了你的配置, 不错
    Roykira
        15
    Roykira  
    OP
       2022-08-11 10:00:57 +08:00
    @xingyuc 如果真的是这样,那这个明确证据可以直接拿出来认定搜狗违约了,是他们在《隐私政策》里面写明了「文本信息、剪切板内容、图像信息、通讯录中的姓名、手机号是不上传服务器的。」 Windows 版本的搜狗都没敢写这句话。
    Roykira
        16
    Roykira  
    OP
       2022-08-11 10:02:02 +08:00
    @dreamramon 所以您是从那一句话看出我在洗搜狗的,还是说只要我没有明确说明「搜狗是垃圾」我就是在替它洗地?
    neochen13
        17
    neochen13  
       2022-08-11 10:51:25 +08:00
    @bs10081 谢谢大佬,打字不会闪,试一下看看
    warron
        18
    warron  
       2022-08-11 10:51:40 +08:00 via iPhone
    用原生了。适应了几天感觉很好
    leeum
        19
    leeum  
       2022-08-11 11:25:29 +08:00
    原生输入法最大的问题就是卡顿,不知道 12.5 会有改善么,我 12.4 有些时候依然是卡顿(原生拼音)
    lB2cGz9OQ1agw7XK
        20
    lB2cGz9OQ1agw7XK  
       2022-08-11 15:30:19 +08:00
    最近从 rime 转到 QIM 了
    AndyVTEX
        21
    AndyVTEX  
       2022-08-11 17:33:07 +08:00
    @szqhades QIM 官网在哪里呀,找了半天好像没有...
    lB2cGz9OQ1agw7XK
        22
    lB2cGz9OQ1agw7XK  
       2022-08-11 17:39:27 +08:00   ❤️ 1
    @AndyVTEX 没有官网,作者只在 QQ 群发布,Q 群:89176460
    AndyVTEX
        23
    AndyVTEX  
       2022-08-11 17:55:10 +08:00
    @szqhades 好的,多谢哈
    xingyuc
        24
    xingyuc  
       2022-08-11 18:53:55 +08:00 via iPhone
    @Roykira 而且还有其他平台通过注入其他进程来获取联网权限的事,隐私政策管用的话还要工信部还刷什么存在感
    bs10081
        25
    bs10081  
       2022-08-11 19:31:17 +08:00
    @astkaasa
    @neochen13

    求 GitHub 小星星🥺
    neochen13
        26
    neochen13  
       2022-08-11 22:16:48 +08:00   ❤️ 1
    @bs10081 已经 star 啦
    franklight
        27
    franklight  
       2022-08-15 14:51:46 +08:00
    @bs10081 大佬,请问你这个支持简体拼音吗?我用了以后咋不能拼音打字的呀
    bs10081
        28
    bs10081  
       2022-08-16 13:36:12 +08:00
    @franklight #27 支持啊,Ctrl + ~ 就可以進入選單,然後在裡面選擇 [朙月拼音 简化字] 。

    示範 Video: https://sync.bs10081.com/f/a80c0cc3479f4e5e8304/
    Roykira
        29
    Roykira  
    OP
       2022-08-18 08:49:58 +08:00
    好了,帖子可以结帖了。
    《互联网信息服务算法推荐管理规定》发布了,算法被规范了,输入法的算法是最容易出卖隐私的,建议大家不要用国产输入法了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2805 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 12:41 · PVG 20:41 · LAX 04:41 · JFK 07:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.