V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
zixiao233
V2EX  ›  分享创造

第 13 期-在线的文章摘要生成器, 自己写了一个支持中文的

  •  
  •   zixiao233 · 2020-02-15 16:51:05 +08:00 · 2386 次点击
    这是一个创建于 1778 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大家可能还记得我写的第 12 期-在线的文章摘要生成器,使用 NLP 生成简介

    在那篇文章里我们介绍了一款通过 NLP 分析文章,自动生成摘要的一个小工具。

    当时我就说这个玩意,还是很实用的,于是就上手自己撸了一个支持中文生成文章摘要的生成器。访问地址http://zhaiyao.xiezuoguan.cn/ 在这里插入图片描述 效果还可以,我找一篇腾讯网的新闻报道来给大家试验一下,报道为《无聊催生的一次狂欢:云蹦迪、云睡觉,虚火一场?》

    经过我们的自动生成器,将内容概括如下

    博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用 户围观他睡觉。

    1 月 9 日开始,每天 5 小时,连续三天“云蹦迪”直播后,北京知名夜店 ONE THIRD 在抖音赚到了 332.36 万打赏,单日超过 100 万元,直播首日收看人数就已破百万。博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用户围观他睡觉。

    在这里插入图片描述 从我个人的使用效果来看,效果并非完全令人满意,最好还是有人为介入来二次加工一下。二是现在文字阅读内容质量堪忧,自从自媒体开始兴起,每天网上产生的都是大量的文字垃圾,大部分人更是失去了对于 1000 字长文以上的阅读能力。篇篇都是几百字的小文章根本没什么好办法生成 120 字内的摘要概括啊。

    另一方面流量也越来越便宜,人们的文字阅读兴趣更是被图片和短视频瓜分掉了。我自己试用这个工具时,去腾讯网上翻了很多篇新闻,结果三分之一是以图片为主,图片中有零散文字(确实排版会更精美,信息量也足够),另外三分之一都是不超过 1000 字的短篇。剩下的三分之一里面,还被视频给占据了一部分,只有极少数的文章能写到 1000 字以上用这个工具来好好概括了。

    技术方案

    难度系数 ⭐ 我这边是用 python 写的,参考了网上的一些方案。部署时本来打算探索一下新东西用一下腾讯云的云函数和 api 网关,结果折腾了半天好麻烦啊,最终还是部署在了服务器里。 前端我不擅长,做的特别丑,能用就行吧。

    我们可以怎么做:

    上次提到的,Chrome 插件这个需求还可以做。

    另外我还发现,如果以后大家倾向于视频内容,不如做一个能够支持视频自动摘要的工具。但是这个就很难了,随口一说,短期内应该还是人力才能解决的工作。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2491 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:33 · PVG 23:33 · LAX 07:33 · JFK 10:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.