V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
smallpython
V2EX  ›  奇思妙想

假如用户可以对搜索结果进行评分

  •  
  •   smallpython · 2020-06-18 19:16:46 +08:00 · 2895 次点击
    这是一个创建于 1397 天前的主题,其中的信息可能已经有所发展或是发生改变。

    当用户使用搜索引擎查找信息时, 如果某一个网页提供了用户需要的信息, 那么用户就对这个网页点一个赞

    然后搜索引擎在系统内部关联起来搜索内容与搜索结果的点赞数

    是不是可以打造出一个完美的搜索引擎?

    35 条回复    2020-06-23 13:03:40 +08:00
    smallpython
        1
    smallpython  
    OP
       2020-06-18 19:18:07 +08:00
    总感觉现在的搜索结果不尽如人意, 有没有哪个搜索引擎做了类似的事情?
    xmumiffy
        2
    xmumiffy  
       2020-06-18 19:20:00 +08:00 via Android
    360 做过 但是不了了之了
    ronman
        3
    ronman  
       2020-06-18 19:21:05 +08:00 via Android
    本身搜索引擎内部就会类似的评分机制,只不过算法不公开,用户不自觉地参与了。而你所谓的评分机制,本质上并没有什么差别,像现在那些垃圾内容农场一样可以污染搜索结果。
    gzfrankie
        4
    gzfrankie  
       2020-06-18 19:21:09 +08:00 via iPhone
    其实 google 就是这样,多人点击的网站是有权重的。
    delectate
        5
    delectate  
       2020-06-18 19:27:37 +08:00   ❤️ 1
    饭圈粉丝分分钟让你重新学做人。

    我可不想让肖战、蔡徐坤刷老子的屏幕。
    9yu
        6
    9yu  
       2020-06-18 19:29:33 +08:00 via Android   ❤️ 1
    然后就会有刷评分的,这个想法不靠谱
    smallpython
        7
    smallpython  
    OP
       2020-06-18 19:38:26 +08:00
    @ronman 没有用户的主动参与, 搜索引擎只知道你的点击行为, 并不知道你有没有获取到有用的信息
    smallpython
        8
    smallpython  
    OP
       2020-06-18 19:40:16 +08:00
    @9yu 刷分可以通过限制 IP 与点赞规则, 或者人工筛查, 这个问题不应该是不做这个功能的理由吧
    smallpython
        9
    smallpython  
    OP
       2020-06-18 19:42:31 +08:00
    主要是感觉现在搜点东西太费劲了, 希望大公司能把搜索引擎体验做的好一些
    Zheming
        10
    Zheming  
       2020-06-18 19:54:42 +08:00 via iPhone
    @smallpython 光饭圈打榜就拦不住。每个都是真人真 ip,咋防范?
    hooopo
        11
    hooopo  
       2020-06-18 19:55:26 +08:00
    完美过头了
    maemual
        12
    maemual  
       2020-06-18 19:57:21 +08:00
    @smallpython #7 Google 貌似是按照你点击搜索结果之后的停留时长来看内容质量的。点击某个结果很快就退回来,说明质量不行。
    evill
        13
    evill  
       2020-06-18 20:09:08 +08:00
    了解一下 google 如何被提出去的
    就知道这个漏洞在哪里了
    Szhi
        14
    Szhi  
       2020-06-18 20:10:23 +08:00
    用户很懒的~
    zouri
        15
    zouri  
       2020-06-18 21:25:55 +08:00
    垃圾公司可以刷分
    靠 ip 防不住,靠人工成本太高,靠账号人家可以养号
    ronman
        16
    ronman  
       2020-06-18 21:29:45 +08:00
    @smallpython 不仅仅是一个点击行为,会追踪很多信息,不然为什么谷歌被骂的这么惨。你看看看谷歌自己的简单介绍:https://www.google.com/search/howsearchworks/algorithms/
    评价一个网页的价值维度应该有很多,只是一个点赞的话很容易被滥用。我觉得这不仅仅是一个技术问题,而是人性的问题,只要网页内容是人生产的,算法是人设定的,那就会有人钻空子,毕竟流量为王,他管你体验好不好
    mumbler
        17
    mumbler  
       2020-06-18 21:32:19 +08:00 via Android
    dgg 就是专门对链接评分的,最高时候估值 2 亿美金,结果后来被刷评分,就没人再信了
    hcocoa
        18
    hcocoa  
       2020-06-18 22:42:00 +08:00   ❤️ 1
    不需要显式打分。谷歌的话,如果你点了搜索结果的第一个链接,很快又点了第二个,那么它就知道你对第一个结果不满意了,如果翻页,那就是对第一页不满意。另外如果对方网站装了谷歌分析,可以获得更详尽的停留时间等数据。
    optional
        19
    optional  
       2020-06-18 22:44:36 +08:00 via iPhone
    ipv6 都来了,靠 IP 限制刷分?不存在的
    imdong
        20
    imdong  
       2020-06-18 22:44:52 +08:00
    曾经做医疗的时候,有个快排系统,就是快速排名。

    大致原理就是模拟很多用户去搜索你的关键词,然后找到你的关键词,去点击。

    我猜搜索引擎内部会有一个类似的打分系统。

    比如你打开了第一个结果,很快又来点开了第二个结果,然后又来打开了第三个结果,然后你没有继续打开其他结果。

    这时搜索引擎有理由认为,这第三个链接解决了你的问题,会间接影响他的排名。
    smallpython
        21
    smallpython  
    OP
       2020-06-19 09:13:53 +08:00
    @mumbler 原来真的是因为刷分而不能做这样的功能嘛......人比机器还要可怕....
    smallpython
        22
    smallpython  
    OP
       2020-06-19 09:14:44 +08:00
    @maemual 停留时长是搭配 chrome 来监控的吗
    smallpython
        23
    smallpython  
    OP
       2020-06-19 09:17:37 +08:00
    @imdong 你说的挺有意思的, 不过我觉得靠程序去猜测还不如让用户直接反馈来的直观准确
    smallpython
        24
    smallpython  
    OP
       2020-06-19 09:18:31 +08:00
    @zouri 难道就没有什么好办法提高他们刷分的成本了吗
    smallpython
        25
    smallpython  
    OP
       2020-06-19 09:22:13 +08:00
    @hcocoa 你说的这个好像还不错, 不知道百度有没有这样的逻辑
    Achiii
        26
    Achiii  
       2020-06-19 11:08:25 +08:00   ❤️ 1
    亟需一个不感兴趣功能
    dingwen07
        27
    dingwen07  
       2020-06-19 13:24:46 +08:00
    @smallpython 谷歌默认打开链接是不新建标签页,这样如果用户返回谷歌它就知道了
    mapper
        28
    mapper  
       2020-06-19 14:15:21 +08:00
    这样只会引入一批商家刷分, 还嫌现在的广告不够多吗
    zdnyp
        29
    zdnyp  
       2020-06-19 15:02:10 +08:00
    想多了,黑产产业链你无法想象
    hmidesigner
        30
    hmidesigner  
       2020-06-19 16:04:32 +08:00
    这种需要从交互角度出发考虑,有时候靠用户做评价不如根据用户的一些行为来判断来得真实。
    比如通过统计页面停留时间、点击结果跳转的次数、点击下一页的次数
    libook
        31
    libook  
       2020-06-19 18:09:37 +08:00   ❤️ 2
    先看现在的搜索引擎是怎么工作的。

    搜出来的页面,如果有用户想要的链接,用户会主动去点,没有的话用户会尝试换关键词搜索,直到搜到了想要的链接就会点击。

    那么搜索引擎只需要看用户点的是哪一个链接,然后根据链接在搜索结果的页数及位置来评估当前搜索结果是否足够好,如果普遍用户翻到第二页才点击链接,那么显然这个搜索结果是不够好的,搜索引擎可以自动把链接提到第一页。
    然后根据相同的关键词搜到的各项结果的点击情况来排列前后顺序。
    如果想做个性化的话,可以拿公共的排序作为默认排序,再根据个人的搜索和点击历史来动态调整这个用户看到的搜索结果的顺序。
    再准确一点的话,可以关联用户一次连续会话中搜索的关联词,比如你先搜了意大利音乐,紧接着又搜了太阳,那么就会前排显示意大利歌曲《我的太阳》的结果。
    如果想更准确的话得让搜索引擎理解搜索关键词和搜索结果之间的关系,这个就得上自然语言处理和人工智能了。

    通过用户的搜索行为、点击行为以及所点击的链接在搜索结果的位置,基本就可以非常准确和全面地反映用户对搜索结果的满意度了。楼主可以思考一下,点赞是否能够比上述方案更加准确和全面的反映用户对搜索结果的满意度。

    搜索引擎发展这么多年有很多技术来提升搜索结果的质量,但为什么搜索结果还是没有达到完美的程度?

    不同人对同一事物的描述很可能是有差异的,而相同的关键词在不同上下文也可能代表不同的含义,人类之间交流还有可能因为信息不对等而产生误解,更何况搜索引擎。

    所以其实各大搜索引擎都很清楚每个用户对每次搜索结果是否满意,问题是知道了也没用,提升搜索准确性本身就是个很难的问题。
    feiyang221
        32
    feiyang221  
       2020-06-21 08:04:19 +08:00 via Android
    Google 的 brain 算法是衡量用户体验的。
    话说回来,页面质量不会交给用户去评判,这是搜索引擎生存的核心。
    从数据收集角度来讲,评分增加了用户负担,参与评分的人数不可能是全部,其中又包含了蓄意评分。数据质量可想而知。
    但每个人都会有浏览器行为,这个数据分析起来质量就高多了
    newmlp
        33
    newmlp  
       2020-06-22 19:10:33 +08:00
    用户都是傻逼,能评出啥玩意
    no1xsyzy
        34
    no1xsyzy  
       2020-06-23 13:00:25 +08:00
    看看知乎高赞变什么样了
    抖机灵将占据主导地位。
    no1xsyzy
        35
    no1xsyzy  
       2020-06-23 13:03:40 +08:00
    @smallpython #22 你的点击是一个 track url 而不是直接的目标页面,你什么时候、在什么关键词上、点击了什么链接是非常清楚的。
    事件在 <A> 标签的 mousedown 属性上,我曾经写过在 mousemove 的时候清空之的脚本。
    另一方面是 google analytics 也可以提供数据。拒绝 ga 从我做起。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5164 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 09:43 · PVG 17:43 · LAX 02:43 · JFK 05:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.