ungrown 最近的时间轴更新
ungrown

ungrown

🏢  电子工程师
V2EX 第 109055 号会员,加入于 2015-04-04 10:56:46 +08:00
今日活跃度排名 23288
3 G 67 S 14 B
circle jerk 怎么翻译
问与答  •  ungrown  •  52 天前  •  最后回复来自 IgniteWhite
9
gboard 为什么无法保存记住词库
问与答  •  ungrown  •  81 天前  •  最后回复来自 churchmice
7
ungrown 最近回复了
1 天前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
@ch2 #59
tesseract 单就字符识别这块其实不算落后,它只是没有对输入的图像进行很强针对性的预处理,这活交给用户了。
很多现代的 ocr 工具都是杂糅了大量的图像处理、内容分块、排版识别、以及字符处理,运算量极大,多数都是依托于机器学习、深度学习的,不上显卡的话运算速度非常慢。
然后这类新式工具如果要加几个特别的字符的话,就得重新训练一个模型出来。扩展性这方面 tesseract 反而方便得多。
tesseract 就是功能比较少、比较基础,很多字符识别之外的事情得用户自己做。
1 天前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
OCR 这东西我上半年摸鱼玩了一会儿,也是拿 python 写的代码(基本只会这个语言目前),也是着重尝试了 tesseract 。
我个人觉得 tesseract 还是很不错的,性能也好,扩展性也好。不过就是对输入图像的要求有点高,需要预先处理一下,我当时也趁着这个机会玩了玩 opencv 里面的二值化,平均权重、高斯权重窗口之类的。
只要对图像进行合理的预处理,效果还是很好的。其实现在很多不管是开源还是商用闭源的 OCR 库,也都是在输入图像的预处理、和识别模型这两个方面同时下手,单抓一手的效果是不尽如人意的。
tesseract 的模型其实一直在更新迭代,版本号也一直在动。说它落后是不对的,只能说它是个很基础的工具,要想用 tesseract 实现更好的效果需要自己额外做一些工作。
我不是机器学习、人工智能之类的科班出身,不过能确定的是 tesseract 的引擎也是神经网络,长短期记忆 LSTM 。
我当时玩下来的经验是,喂的图像得够干净,最好是白底黑字的二值图,或者浅色底深色字符,如果深色底色的话识别效果会明显劣化。完事噪声一定要少,不管是噪点、摩尔纹、还是大片的强光。
图像预处理的时候最好分区块,除非是电子文档的截图,否则总会有不同内容的区块互相干扰,哪怕同样是文字区块,亮度颜色如果不同也不能用相同的方法和参数来处理。
但即使得到了黑白分明字符清晰的二值图,依然是不够的。tesseract 并不能很好地识别各种段落结构、表格结构、复杂排版,它只能应付相对简单的(也有不小的出错概率)。所以最好是先识别出小的文字区块单元,把整个“文章”打散,变成单行、单词。这个可以用 tesseract 自带的接口,也可以用其他什么算法工具,反正只要把所有的字符区块和对应的坐标提取出来,后面只要把这些区块批量识别,再重新按照坐标把结果区块拼起来就行。
思路就是这么个思路,其实其他 OCR 库也基本上是这个套路,去噪、归一、化整为零。
至于 easyocr 和 paddleocr 这种,我也试用过,准确率和适应性确实比 tesseract 好上不少。不过这类工具一般都是机器学习 /深度学习的范畴,虽然也是神经网络为内核,但一般对算力要求更高,得上显卡,否则纯靠 CPU 算就很慢,明显比 tesseract 要慢得多。我手头的二手闲鱼本,4 代酷睿 2C4T 的 CPU ,用 opencv+tesseract 处理一帧 640x480 的图像差不多 300ms 左右,用 easyocr 需要 1 、2 秒,用 paddleocr 得要 5 、6 秒。我当时拿我自己写着玩的代码,python+OpenCV+tesseract ,基本可以在这个分辨率下“实时”显示摄像头中的文字了,而且是窗户阳光直射下,文字媒介表面不平整(键盘上的字,饮料瓶身贴纸),虽然有不少错误识别,但至少画面移到哪儿,一眨眼的功夫就能在命令行里看到对应的文字。换用 easyocr 和 paddleocr ,得等“半天”,而且同样有不少错误(当然比 tesseract 少一些)。
OCR 这个东西虽然算是“半成熟”的技术了吧,但还远没有完整。很多开源项目还在发展,还有很多公司已经在用自己改进的半成品在赚钱了,更有大型企业组织在积极推动底层关键技术。这里面的门道很多,水非常深。如果只是自己玩玩或者要求不太严格的应用的话,请善用他人智慧成果和“权宜之计”,真想短时间做个“尽善尽美”的东西出来是做梦。
@ClericPy #13
> 大哥... 你让我在上班期间打开了一个本来不该打开的网站.......
我还特意提了一下这些大多是涩图站,不过确实不够着重。
不过 danbooru 这个还好哦,算口味清淡的了,关得够快的话别人顶多以为是个二次元图站。
要 SFW 的话,刚刚搜了一下,safebooru ,这个不涩。
@JustRookie #7
我在用的这个笔记本,二手的老本,就偶尔会莫名其妙蓝屏,报错也是内存管理。
我很久前就怀疑是内存条有毛病,于是就重启跑内存测试,跑了三四遍也没见查出错误。见鬼了?于是狠下心跑了一整个晚上,第二天看屏幕,十几遍就查出来一个错。
我思忖片刻,决定默默地无视这个结果,急需凑合用着。就这么一直用到现在,依然会隔一两个月,就毫无征兆地蓝屏。不过我是从不关机也不休眠,基本上只睡眠,估计每天都关机重启的话,兴许还不会蓝屏。
4 天前
回复了 lslvxy 创建的主题 NAS 求推荐一个家用的微型服务器
@TimPeake #92
Owner of the Post
可是这样一个“虚拟机”,它必然是要求很多权限的啊,不然它怎么确保里面安装的应用可以获取所需的权限呢?又不能等到里面的应用申请权限的时候再由虚拟机来传递,这个虚拟机也只是个普通的应用。而应用所需要的权限是在设计的时候就由代码决定的,发布后的应用需要哪些权限那就是需要哪些权限,又不会临时多一个需求,顶多在安装时安装后不给它某些权限,只能关,不能不让它提。
这不就是各大 booru 站点吗。
booru 站点就是 danbooru 这一类 imageboard 网站,即贴图讨论版,内容其实包括图片、视频、wiki 等。由用户上传内容,文件直接按照 hash 命名存储 /去重,额外标记元数据,让用户自行打标签,在此基础上实现内容的审查、发布、搜索、访问、排行榜、推荐。
甚至这套建站模板都是开源的,更有魔改和变种,很多涩图站都是这种(瑟琴果然是第一生产力
@Accessing #12
python 能发展起来其实跟它一开始的定位和特点还是分不开关系的。强类型、动态类型、易于扩展的 C 接口、简洁的语法……讲真,如果真的仅仅是为了写个脚本,这个语言没必要具备这些属性,显然 python 的创始人从一开始就考虑了很多。
论优劣,在不考虑计算性能的情况下,python 在应用上和主流语言打得有来有回。即便考虑性能,如今的借助 cython 、JIT 也能把 python 的性能提高一两个数量级,几乎能摸到 C 的脚后跟了。而以“性能”为代价换来的,是无比简洁的语法,是明显更少的代码量和开发成本。
python 门槛低上限高,易学易用。在“上得了台面”、“赚得了名利”的场景以外,python 还在各行各业被用来写各式各样的脚本、工具包,帮助人们提高效率、方便工作、享受生活。真心的,哪怕就算 python 在商用领域绝迹,甚至不能拿来谋职,这个语言依然会被无数人拿来写各式各样的工具,尤其是那些“低含金量”的应用场景,是其他主流语言难以覆盖的。
python 作为当今最强胶水,有着如同菜市场般热闹的生态,这种“勃勃生机、万物竞发”的境界,真的和它易学易用、无限可能的秉性是分不开的。
4 天前
回复了 dangyuluo 创建的主题 Linux 想知道应该用 LVM 还是 ZFS? 以及最佳实践
Linux 下面,根目录尽量别用 ZFS ,其他随意。因为 ZFS on Linux 还没有稳定到那个程度,而且就算不考虑稳定性,如果根目录是 ZFS 的话相当于整个启动过程多依赖了一个复杂组件,在出问题的时候增加排错成本。
ZFS 确实挺好用的,本身也具备 RAID 这种形式,灵活又方便。能用就用,利大于弊,根目录除外。
8 天前
回复了 Ives 创建的主题 宽带症候群 广州移动半夜 qos
移动家宽就是半夜强 QoS ,我这江苏也是如此。其实现在算好了,以前到了晚上就不行了。不过我也一直没想明白为什么大半夜这种谷期要限流,也许是防止有人专门趁晚上跑流量?也许是和国外服务商签订的合作协议是节省成本的分峰谷的然后就选深夜作为限流谷期?
关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1084 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 21:22 · PVG 05:22 · LAX 13:22 · JFK 16:22
♥ Do have faith in what you're doing.