V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
hahaha121
V2EX  ›  程序员

基于 ai 开发推荐系统的可行性?

  •  
  •   hahaha121 · 4 天前 · 1989 次点击

    假设有 10W 的用户数据,每天浏览新闻,是否是可以通过把用户的 id 和用户看过的新闻记录给过去,然 ai 自动分析用户对那些种类的新闻更感兴趣?

    19 条回复    2025-01-13 18:54:06 +08:00
    woscaizi
        1
    woscaizi  
       4 天前
    今日头条是一款信息类互联网产品,它会基于数据挖掘的推荐引擎向用户推荐文章。它由中国互联网创业者张一鸣于 2012 年 3 月创建,于 2012 年 8 月发布第一个版本。
    hahaha121
        2
    hahaha121  
    OP
       4 天前
    @woscaizi 这种需要搭建数据分析后台技术栈有点多哦,我指的是直接用现有的通义之类的 ai 模型,然后之后得到推荐结果
    qiniu2025
        3
    qiniu2025  
       4 天前
    当然可以,但是很不可控,要控制 AI 按需要的方式推荐,还需要做很多工作,比如建立标签库,抖音给每个人都有 3000 个标签,训练专用的模型才能降低成本,用这些公开几十亿,几百亿参数的模型亏死
    hahaha121
        4
    hahaha121  
    OP
       4 天前
    @qiniu2025 亏死是指 token 太多吗? 每个人 3000 个标签,是啥玩意好奇
    ns09005264
        5
    ns09005264  
       4 天前
    如果标签系统好的话,推荐系统用不上昂贵的模型就能有好的效果。
    所以可以在源头上使用昂贵的模型对文章或视频进行标签分析,建立完善的标签系统,剩下的就可以用廉价的模型进行推荐。
    gaobh
        6
    gaobh  
       4 天前 via iPhone
    可以是可以,花的 token 估计不是一般的多
    hahaha121
        7
    hahaha121  
    OP
       4 天前
    @ns09005264 好主意,成本巨降;
    hahaha121
        8
    hahaha121  
    OP
       4 天前
    @gaobh 数据格式提前做压缩,压缩成特地的协议好的简化格式可以省一点,但可能扩展性不高; 5L 的方案感觉非常完美
    GeekGao
        9
    GeekGao  
       4 天前
    @woscaizi 最早最算法推荐的不是张一鸣的今日头条,而是郑钧的玩聚 sr ,那会儿大概是 2008 年左右。
    huluhulu
        10
    huluhulu  
       4 天前   ❤️ 1
    别把现在的 AI 神话,不过是 LLM 、AIGC 而已。
    做这种事情,用数据挖掘/ML 之类的推荐系统足够了,效果比 LLM 好多了,成本还省很多。
    要了解 LLM 的边界。
    musi
        11
    musi  
       4 天前
    v2 现在的标签也是由大模型驱动了,你可以去搜一下 livid 发的帖子
    Yadomin
        12
    Yadomin  
       4 天前
    这不就是最新最热的 Generative Recommendation 吗
    w568w
        13
    w568w  
       4 天前
    这个想法早在 LLM 刚流行那年就被研究烂了,结论是系统更重要。LLM 在系统中的地位固然重要,但系统设计本身和 LLM 其实没有太大关系,反而要为了 LLM 做出许多妥协(例如输入不能太长,输出要经过校验,优化硬件满足实时性要求等等)。
    woscaizi
        14
    woscaizi  
       4 天前
    @GeekGao 郑昀-玩聚 SR 貌似和个性化推荐不一样
    murmur
        15
    murmur  
       4 天前
    推荐系统核心算法 :selelect title,content,author from articles order by paid_money desc
    murmur
        16
    murmur  
       4 天前
    你这个东西有点悖论,就是新闻是没法推荐的,因为新闻的发生不以用户的主管爱好为转移,除非是编造的假新闻和洗稿新闻

    比如我喜欢看美国着火,美国枪击,这事即便是美国也不够我看的啊
    GeekGao
        17
    GeekGao  
       3 天前
    @woscaizi 非要说算法那肯定不一样(具体你可以看看他博客的历史存档),但是效果是差不多的。只是那会儿没有移动端。相比头条收集信息的维度少(例如性别、LBS 数据),底线更高,只推荐全网大 v 的内容,而非头条系杂七杂八的自媒体小黄文
    RealMan
        18
    RealMan  
       3 天前
    LLM 和推荐系统的结合一直都很火,我自己也是研究相关方向的。现在比较认可的方向是生成式推荐和对话式推荐,和用户的多轮对话,不断捕获用户兴趣,生成跟用户兴趣相关的推荐产品。和传统推荐系统是互相促进的关系,不是取代。
    neptuno
        19
    neptuno  
       3 天前
    术业有专攻,你可以按照大模型技术栈训练一个推荐系统,而不是调用 api
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5955 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 02:32 · PVG 10:32 · LAX 18:32 · JFK 21:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.