V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
paulguo
V2EX  ›  问与答

求一个帖子推荐算法(根据帖子支持和帖子不支持的人数以及帖子创建时间)

  •  
  •   paulguo · 2012-09-07 19:58:46 +08:00 · 2997 次点击
    这是一个创建于 4464 天前的主题,其中的信息可能已经有所发展或是发生改变。
    比如数据库中存有如下三个字段:

    ----------------------------------------
    | id | support | unsupport | timestamp |
    ----------------------------------------
    | 1 | 45 | 19 | 14223xxxxx|
    ----------------------------------------

    根据这三个字段,如何才是比较好的自动推荐?
    7 条回复    1970-01-01 08:00:00 +08:00
    hu437
        1
    hu437  
       2012-09-07 20:45:59 +08:00
    如果只根据这个基本上没有太好的,现在的推荐主要有两种,协同过滤和内容相似度;内容相似度可以使用TD IDF,你这个比较适合使用协同过滤中的基于用户的协同过滤。
    比如用户A,支持了帖子1、2、3
    用户B,支持了帖子,1
    用户C,支持了帖子,1、3
    那就可以为用户C推荐帖子2
    hu437
        2
    hu437  
       2012-09-07 20:46:30 +08:00
    可以使用TD IDF和上面的这个协同过滤结合的方法
    Js
        3
    Js  
       2012-09-07 20:48:56 +08:00
    这几个字段只能(support-unsupport)/(now()-timestamp)*N因子吧

    阮一峰今年年初写过几篇《基于用户投票的排名算法》的
    paulguo
        4
    paulguo  
    OP
       2012-09-07 20:51:20 +08:00
    @hu437 @Js thx, 我没表述清楚,不能算是推荐,其实是为了生成一个HOT LIST。我参考下Js的算法,跟前几天看的讲Digg算法的一文中提及的算法类似。
    best1a
        5
    best1a  
       2012-09-07 20:57:10 +08:00
    要不参考下Reddit的?
    http://songshuhui.net/archives/66981
    leiz
        7
    leiz  
       2012-09-07 21:58:07 +08:00
    你要的是一个排序优先的取舍吧。
    先排s+us总数,然后排时间,例如一周内,最后排s
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3251 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 13:01 · PVG 21:01 · LAX 05:01 · JFK 08:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.