V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
wontoncc
V2EX  ›  问与答

老板想做一个根据关键词自动生成报告的软件,不知道大概要多少钱?

  •  
  •   wontoncc · 2018-01-10 12:54:23 +08:00 · 4066 次点击
    这是一个创建于 2502 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大概需求如下:

    1. 用户输入关键词,软件在数据库中筛选出命中率最高的几篇文章;
    2. 以这几篇文章为基础,截取目标句型的句子(如 XX 是…,XX 将会导致…,XX 即… 等 5W1H 类句子);
    3. 组合所截取的句子生成专题报告初稿( Word 文档)。

    完全不了解市场,想求问一下找团队或个人开发这样一个应用大概需要多少钱?先行谢过提供信息的各位。

    第 1 条附言  ·  2018-01-10 23:00:20 +08:00

    谢谢各位,看了回复都是觉得需求不够清晰,那我再整理叙述一下:

    背景

    是文秘部门需要向上的各级领导汇报及向下发布专题报告,所以数据库的材料来源是有限且相对固定的,主要包含 公司的发文、管理体系的叙述性文件、近期所发布的生产政策叙述性文件等

    需求

    目前,文秘人员撰写专题报告时,一般会就某个关键词进行展开,展开的内容通常涉及5W1H。当前文秘人员在着手解决这个问题时,是这样做的:

    1. 先搜集所有涉及到此关键词的资料;
    2. 再对这些收集到的资料进行阅读,筛选,摘抄;
    3. 再通过整合删减,最终完成报告的初稿。

    希望通过软件,来简化甚至自动化实现这一个过程。其中,流程1、2是希望能够尽可能完成的,即按照原PO要求尽可能精准的采集数据库中的材料,并针对所提及的目标句型进行归类。因为这类型公文的行文风格相对统一,所以自然语言理解的需求我相信是比较低的。而流程3最好能够做到初步表达所有5W1H要素(即如回复提及的自动写稿);这个我个人感觉相对困难,老板也认为软件早期的版本这个功能可以完成度低一些,因为最终还是需要文秘人员进行润色的。

    15 条回复    2018-01-11 16:37:45 +08:00
    fengchang
        1
    fengchang  
       2018-01-10 14:05:28 +08:00   ❤️ 2
    我觉得看效果吧,如果对报告的质量没什么要求一千万应该就够了
    stevenhan
        2
    stevenhan  
       2018-01-10 14:19:30 +08:00
    现有技术生成的初稿再好也要人工润色,既然要雇有能力润色的人工,那他做文章提取也很容易。
    感觉现有的信息检索就够搞定 1, 雇人做 23 不错。
    murmur
        3
    murmur  
       2018-01-10 14:27:40 +08:00
    这不就最早舆情分析的原型吗
    后来发现这种系统屌用没有,管事的还是检测到关键字就删帖
    所以要么就简单粗暴卵用没有,要么就靠专业写手
    wontoncc
        4
    wontoncc  
    OP
       2018-01-10 16:01:22 +08:00
    @stevenhan 其实我也觉得既然都要人最后润色,那么做个软件意义也不大,然而老板想要… :x
    TimePPT
        5
    TimePPT  
       2018-01-10 16:13:47 +08:00
    wontoncc
        6
    wontoncc  
    OP
       2018-01-10 17:15:59 +08:00 via Android
    @TimePPT 有点像,但是比他这个简单了,应用场景也不同。
    mlhorizon
        7
    mlhorizon  
       2018-01-10 17:17:34 +08:00
    三句话需求的项目,风险系数要 X 10。
    wontoncc
        8
    wontoncc  
    OP
       2018-01-10 17:21:15 +08:00 via Android
    @mlhorizon 有个详细的文档,不过主要是想先了解一下价格,所以也没搬上来。感觉说的也是这些话,看来我整理一下再 APPEND 一下比较靠谱。😂
    TimePPT
        9
    TimePPT  
       2018-01-10 17:38:24 +08:00
    @wontoncc 感觉想要的即使自动写稿机器人……
    TimePPT
        10
    TimePPT  
       2018-01-10 17:38:43 +08:00
    @TimePPT 纠错 即使——>就是
    schoolers
        11
    schoolers  
       2018-01-10 17:40:22 +08:00
    我这里有成型的系统,可以免费给你们用,可以联系我,昵称就是微信,备注 v2ex
    shoumu
        12
    shoumu  
       2018-01-10 17:54:13 +08:00
    说得太泛了

    面向具体的领域还是开放域?
    数据库的大小?数据库的获取方式?
    截取目标句型是直接抽取文章中的句子?还是需要一定的自然语言理解?
    。。。还涉及到很多的问题吧

    之前在实验室的时候给外面的公司做过类似的系统 http://buzz.yeesight.com/ ,和你的这个需求有相似的地方,但是细节问题太多了,你给的这个需求太简单了

    至于钱,看你要做成什么样子了
    schoolers
        13
    schoolers  
       2018-01-10 20:20:24 +08:00
    @shoumu 你这个获取的是原有的文章,只是采集加清洗。而需求我认为是偏向于自动写稿的。
    wontoncc
        14
    wontoncc  
    OP
       2018-01-10 23:00:56 +08:00
    @schoolers
    @shoumu

    是的,倾向于自动写稿。跟 @shoumu 给出的系统感觉差点比较远。我在 APPEND 里面补充了一些细节,烦请两位还帮我看一看。
    shoumu
        15
    shoumu  
       2018-01-11 16:37:45 +08:00
    @schoolers
    我没有说清除,这个系统里有根据关键词生成报告的功能的,对于生成报告这块,我关心的是抽取式的还是生成式的,难度差得挺多的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2703 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 11:40 · PVG 19:40 · LAX 03:40 · JFK 06:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.