V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mfsw
V2EX  ›  OpenAI

聊天机器人,如何训练?

  •  1
     
  •   mfsw · 51 天前 · 1067 次点击
    这是一个创建于 51 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如题,喂他几本书,然后在给她一些资料, 怎么根据这些资料, 能训练出高质量的聊天机器人呢?

    7 条回复    2024-10-29 13:24:50 +08:00
    musi
        1
    musi  
       51 天前
    几本书就想高质量?那也不用 Scaling Law 了
    kaichen
        2
    kaichen  
       51 天前
    大力出奇迹,几本书是不够,要很多很多。

    参考,推理能力超过 gpt-3.5 的 Llama3

    - https://ai.meta.com/blog/meta-llama-3/
    - https://ai.meta.com/blog/meta-llama-3-1/

    > Meta reports on Llama 3.1's page on Huggingface, using 39.3 million hours of H100 80GB instances to train all 3.1 models (8, 70, 400 B).

    大概是,两万四千张 H100 训练 74 天

    > Llama 3 is pretrained on over 15T tokens that were all collected from publicly available sources.

    大概等同于 60TB 数据,在它的技术报告里,提到这是更大的数据集上做清洗去重的精华

    ---

    所以先有这么多的资源才能训练得到高质量机器人
    lneoi
        3
    lneoi  
       51 天前
    想做机器人客服还是什么?现在基础模型这么多,为啥要重头搞一个
    mfsw
        4
    mfsw  
    OP
       51 天前
    @musi
    @kaichen
    @lneoi
    感谢诸位大佬指点。
    我的想法是,利用现有的 ai/模型,加入一些干预,比如喂它一些书籍资料等,形成自己风格的聊天机器人,使得更好的完成我的需求。其实就是个性化。
    请诸位大佬继续赐教。
    musi
        5
    musi  
       50 天前
    @mfsw #4 那就用 RAG ,但是想把 RAG 做成可用状态需要花大量时间精力,如果能把检索做好的话,你可以做一个 perplexity 出来了。这是一家估值 30 亿美元的公司,正准备将估值翻到 80 亿美元,你考虑一下你能不能 cover 住
    aiqinxuancai
        6
    aiqinxuancai  
       50 天前
    参考 lobechat 的知识库,将书内容量化作为知识库,再写个 prompt 即可
    mfsw
        7
    mfsw  
    OP
       50 天前
    @musi 想想吧,哈哈。

    @aiqinxuancai 这个应该是挺符合我的需求的。感谢指点。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3317 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 11:58 · PVG 19:58 · LAX 03:58 · JFK 06:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.