V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
DjvuLee
V2EX  ›  问与答

基于 ChatGPT 开发的应用怎么保证数据隐私性

  •  
  •   DjvuLee · 2023-04-03 15:57:30 +08:00 · 1245 次点击
    这是一个创建于 625 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在 ChatGPT 这些很火,但是比如开发了一个私人助理,这个需要调用很多私人数据,

    1. 部署在云端,让用户自己做链接认证,这个怎么保证大家相信你?
    2. 私有部署,升级维护使用都是麻烦。

    感觉这一波 ChatGPT 这个难点好难突破。

    12 条回复    2023-04-03 16:32:58 +08:00
    swulling
        1
    swulling  
       2023-04-03 16:04:32 +08:00 via iPhone
    反正最后不都传给 OpenAI 了么。用户不相信,不想数据上传,那他肯定就用不了啊。

    除非用私有化的 LLM
    op351
        2
    op351  
       2023-04-03 16:07:52 +08:00
    就算你加密了
    你的转发加密了
    openai 也没保证不会利用你上传的数据
    Removable
        3
    Removable  
       2023-04-03 16:10:42 +08:00 via iPhone
    @op351 实际上是保证了的,openai 明确说明了不会利用 API 的数据进行训练等操作,并会在 30 天后删除数据。
    DjvuLee
        4
    DjvuLee  
    OP
       2023-04-03 16:10:45 +08:00
    @swulling 现阶段还是没有大量的本地数据上传的,比如你本地的数据库,有的都只是 chat query 里面的。
    但是想要想有个性化的效果,这个是无法避免的。但是私有化部署 LLM 其实就有第二个问题。
    DjvuLee
        5
    DjvuLee  
    OP
       2023-04-03 16:11:21 +08:00
    @op351 现在是,但是只是 query 的数据,隐私性其实还好。
    DjvuLee
        6
    DjvuLee  
    OP
       2023-04-03 16:14:11 +08:00
    @Removable 目前我还是相信 openAI ,但是你看他的 chat 页面上面有 vote-up 和 vote-down ,估计还是会做一些分析的。
    op351
        7
    op351  
       2023-04-03 16:16:14 +08:00
    @Removable
    https://help.openai.com/en/articles/6783457-chatgpt-general-faq
    请看第 6 条
    很明显没有保证 而且态度很暧昧 用的“maybe”
    Removable
        8
    Removable  
       2023-04-03 16:16:23 +08:00 via iPhone
    @DjvuLee 你指的是 openai 自己做的 ChatGPT 的数据吗?那个是会拿去做训练的。我说的是 api
    DjvuLee
        9
    DjvuLee  
    OP
       2023-04-03 16:17:10 +08:00
    @Removable 我说的就是 API 。
    libook
        10
    libook  
       2023-04-03 16:17:22 +08:00
    三星刚刚因为 ChatGPT 出了几次数据泄漏事故。

    如果 AI 引擎是实时学习的,那么肯定保不齐会成为大喇叭,给点赛博咒语就把别人的隐私吐出来了。

    现在的主要问题还是,GPT 只是个语言模型,它是基于概率来计算最可能出现的上下文,它不可能理解逻辑和人情世故,只能尽可能猜得符合惯例。即便是私有化部署企业内使用,也还是要解决信息从高安全等级的岗位流向低安全等级的岗位的问题。

    要么 OpenAI 自己想出办法从底层来解决,要么就只能用于非敏感场景。
    justfindu
        11
    justfindu  
       2023-04-03 16:20:14 +08:00
    保证不了 三星不是刚出事么
    hahastudio
        12
    hahastudio  
       2023-04-03 16:32:58 +08:00
    基于 ChatGPT 不行,ChatGPT 是 OpenAI 的应用,它会有人来阅读你的聊天记录 https://help.openai.com/en/articles/6783457-chatgpt-general-faq

    > 6. Will you use my conversations for training?
    > Yes. Your conversations may be reviewed by our AI trainers to improve our systems.

    基于 OpenAI API 的恐怕也不行,虽然 https://platform.openai.com/docs/guides/chat/do-you-store-the-data-that-is-passed-into-the-api 里面说

    > Do you store the data that is passed into the API?
    > As of March 1st, 2023, we retain your API data for 30 days but no longer use your data sent via the API to improve our models. Learn more in our data usage policy.

    但是 https://openai.com/policies/usage-policies 里面说

    > If we discover that your product or usage doesn’t follow these policies, we may ask you to make necessary changes. Repeated or serious violations may result in further action, including suspending or terminating your account.

    你猜它怎么做到这一点

    如果是基于 LLaMA 、ChatGLM 、Colossal-AI 这些可以本地部署的模型的话,那么数据隐私性就依靠你自己实现了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3191 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 00:18 · PVG 08:18 · LAX 16:18 · JFK 19:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.