ipwx 最近的时间轴更新
ipwx
ONLINE

ipwx

V2EX 第 86855 号会员,加入于 2014-12-15 23:19:35 +08:00
今日活跃度排名 4301
ipwx 最近回复了
15 小时 50 分钟前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
@stimw 这个楼主要的是直接开箱即用。


但是不行。原因我上面说了
15 小时 55 分钟前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
@zictos 因为神经网络就是这么个东西:任何一个简单的 application 都要用基本模块自己搭。不存在通用的工具箱。。。文字识别就是一个特殊的 application
16 小时 9 分钟前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
@zictos 呃不知如何吐槽。。。

因为这个世界上大部分 state-of-the-art 的人工智能算法研究者,每年发的一堆论文,都是 python 语言上实现的 prototype 。。。

人工智能也是程序啊亲。百度的文字识别这一具体 api ,就是人工智能(还不算顶尖)的真实效果啊
16 小时 27 分钟前
回复了 zictos 创建的主题 Python Python 识别图片文字的效果是不是很差?
> 利用程序识别最多只能达到 pytesseract 模块这种程度的效果了吗?

pytesseract 是上古时代的东西啊,十年前的算法。当然比不上好歹有一坨 DL 工程师的百度。

你要牛逼,你自己写模型嘛
这种小工具更适合用 Python 做 —— 插件也容易
1 天前
回复了 refresh 创建的主题 投资 求教一个股票年化计算的问题,回答送分
所以我同一一楼,直接期末资产除以期初资产就行。
1 天前
回复了 refresh 创建的主题 投资 求教一个股票年化计算的问题,回答送分
@refresh 你的需求过于复杂了,而且这个统计有些没有意义。

因为对于投资而言,空仓本身就是一种态度(看空)。事实上,按照证监会的规则,基金是不允许空仓的,不然你以为他们傻啊,真 A 股普跌的时候他们不会空仓嘛?
1 天前
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 说起来当年我做一篇论文,曾经有过最多 20 个实验在跑:四个数据集、每组各 12 个参数的组合,一个大表需要跑。那更是不可能复制 50 个 .py 文件或者 50 个 Jupyter Notebook 呗。只能按照我的工作流,实验代码项目化,IDE 里面自动同步到服务器(有共享文件系统,所以同步到任何一台服务器,等于同步到所有服务器)。

然后超参都通过命令行给,每台服务器还当时用了 Dask Scheduler ,一个好了就启动下一个。基本都是第一天挂上,第二天看结果。。。。

我还写了个 Vue.js 的结果收集页面 hhh
1 天前
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 当然后来做公司项目了,那还是必然差不多还是 IDE 优先 hhh 。反正真的上传代码都是 git push ,部署有 CI 。综上,无论是研究性代码,还是工程性代码,其实 IDE 效率都远高于单独用 Jupyter notebook 或者 vscode 。
1 天前
回复了 AndyAO 创建的主题 Python 那些 Python 语言设计上的重大失误
@kilasuelika 但是你以己度人了。

事实上我写代码从来都用 IDE ,无论是六万行 C++ ( CLion )还是 pytorch 模型( Pycharm )。Jupyter 我基本上只是在服务器上起 Jupyter Lab 用它的终端,实际写模型还是在 Pycharm 里面,打开它的 ssh 自动同步功能,修改的代码就自动上传到服务器了。

然后我当年实验室里面,二十几台服务器我配的,有共享文件系统。这样的好处是,在自己笔记本上修改了代码,瞬间可以在 20 几台服务器(其中四台 GPU ,共 20 几张显卡)的服务器上同时开多个实例调参数——你只是在各个不同服务器上的 Jupyter lab terminal 里面操作而已。这不比一个 Jupyter notebook 强太多了吗?

此外就是,我当年做研究,代码也是有层次、整理成工程的。甚至我自己都有一套自己的 tensorflow 组件库(后来是 pytorch ),可以 pip install 的。实验室不下十篇论文引用了我的组件库。

而且哪怕不是像我这样工程能力比较强的,遵照我的 workflow ,用起来也很爽。就是参考我上面说的,本地笔记本用 IDE 改好以后,瞬间就同步到二十几台服务器上了。真在截稿前 ddl 疯狂跑参数的时候,这实在太重要了。

啊顺便我自己有一套参数保存、读取和命令行读取的库。这样的话一个 .py 可以瞬间人肉调参十几组同时跑。这也是大前提。
关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3947 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 09:09 · PVG 17:09 · LAX 01:09 · JFK 04:09
♥ Do have faith in what you're doing.