V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  moomtong  ›  全部回复第 1 页 / 共 1 页
回复总数  6
ollama 主要的场景还是在个人 pc 上跑模型,没有大范围的生产用例。

RAG 的效果是需要根据数据定制化去调的,首先 embedding 横向对比,然后文档的提取和切分方法,像你提到的 pdf 有些开源 RAG 本身内容提取就做的比较烂,可以看看导入的内容准不准确,表格之类读没读出来,标题和编号之类结构化信息有没有保留、能不能查到等等。还有排序方法也可以定制化去改。进一步提升效果的话内容本身也要做增强,补数据、摘要等等。还有不少其它的,网上资料很多可以看看。

但其实在这些之前,既然是集团公司,他们自己的文档现在是在哪里,云文档?公司有自己的知识库吗、要不要对接、现在有远程会议应用吗、有会议室录音硬件吗、你的服务是类似 gpt 的形式还是已有应用内插件的形式,这些个人感觉是先要考虑/谈的。

语音方面 Whisper 本身能力是很 ok 的,但是很可能还需要说话人识别。然后比较现实的问题是会议录音的音质,有的人可能离话筒远很小声,和多个人同时说话这种,目前业界也没什么很好的解。
国外一些机构半年前就看到$3000usd/oz 了,还早
184 天前
回复了 nicht 创建的主题 程序员 组织架构频繁变动导致一些系统经常出问题
这种我们一般用虚拟组
Memory Map?不确定视频文件行不行
2021-08-09 17:55:43 +08:00
回复了 join 创建的主题 Linux 逃离到 Linux 两周的感受
感觉 lz 总结得,关键就是千万别有强迫症 hh
比如有个桌面小工具只要一点就 segmentation fault——
错误做法:查资料 debug 各种方法修一周,没修好
正确做法:那就别点它 hhh
2021-08-09 17:47:09 +08:00
回复了 Cbdy 创建的主题 支付宝 关于用云闪付完全替代支付宝这件事儿
云闪付属于一看就是在亏钱的产品,支付市场现在大局已定,美团字节这种体量的下场也很难玩得转。所以硬做云闪付应该多少带点政治任务,有羊毛薅的时候还是可以支持一下
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5484 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 08:33 · PVG 16:33 · LAX 00:33 · JFK 03:33
Developed with CodeLauncher
♥ Do have faith in what you're doing.