我有一个加密通讯软件的想法。

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 2198 天前的主题，其中的信息可能已经有所发展或是发生改变。

所有文字应该转换成图片，然后在通讯软件里呈现。甚至是在通讯开始建立时，就打包成图片，以文字打包成图片的方式开始沟通。这种以前防采集的手段……现在应该比那些通用的对称加密算法有用。

第 1 条附言 · 2019-10-11 22:01:02 +08:00

@linksgo2011 那为什么发图能逃避监管，那么牛逼的密码学不能？你用密码学跟一个小学生通讯，他能解吗？这是点对点双方必须要用一样的高度去解的难题。服务端能利用大量现有技术去加密，XXX 电话打过来还不是乖乖交出了 KEY。XXX 说我也不知道怎么办，明文数据库发一份给他咯。所以你想过使用你软件人的感受吗？然而……………………………………关键的来了！用一定算法生产的图片！能躲过 OCR，能消耗 AI 算力，从此变得无法程序化破译、监管！但是大家都肉眼可识！而你只需要解释，这是一个行车记录仪

第 2 条附言 · 2019-10-11 22:16:20 +08:00

@happyz90 这跟 ASCII 码加 N 有什么区别。一张手机宽度乘以 N 的图片跟 ASCII 码离的很远呢。
@delpo 你说的很对。我们目前“加密”通讯需要解决的是监管的问题，并不是纯去搞密码学。
@FrankHB 从监管领域出发，首先他们的服务器算不了那么多图形。如果像审核电影一样，但是人肉是审核不了那么多图片形式的文字。而文字可以用不同颜色的模式（就是查色盲那种）伪装成监控画面，按一秒 24-30 帧，封装数据源。数据记录了，也不是用完扔掉制的，监管也无法建立检索。使用者照常能查阅及通讯。

第 3 条附言 · 2019-10-13 12:21:59 +08:00

@msg7086 因为通讯速度加快、通讯成本降低，这是最近几年才有的变化，图片视频比文字大。过往图片型文字没有必要使用的场景。现在可能快有了。

以下是机器能否识别出人眼能轻易判断的文字，大家可以参与下
https://v2ex.com/t/608815

通讯

加密

打包

图片

96 条回复 • 2021-07-29 13:05:56 +08:00

ZavierXu

2019-10-11 21:07:56 +08:00

不，你没有……

imsuxp

2019-10-11 21:08:24 +08:00

这让我想起当年贴吧用图片发种子。。。

richard1122

2019-10-11 21:08:27 +08:00

"现在应该比那些通用的对称加密算法有用"
这是为何？

把文字转换成图片最多算作一种混淆手段吧，跟加密有什么关系？

heygum97

2019-10-11 21:10:19 +08:00 via Android

我曾经也有过加密通讯的想法。后来在 v2 看到了无数类似的想法和项目。

across

2019-10-11 21:10:50 +08:00

我觉得吧。你好像没理解“数据格式”和“加密”···

areless

2019-10-11 21:15:25 +08:00

@suxiaoxiann @across 民用的才是最见效的。实际上发图的方式最能保持信息常驻，如此简单直接。图片识别内容，需要大量算力去算。
@ZavierXu 我觉得还行，应该能突破某些监视网。

YamatoRyou

2019-10-11 21:15:29 +08:00 via Android

OCR 和强制接入黑箱审查制度即可让你的想法诞生即死亡.
参考微信.

ZavierXu

2019-10-11 21:16:58 +08:00

@areless 你这个不是“加密算法”，你这个只是混淆，或者隐写，如果确保信息加密，pgp 多好，为何多此一举？

Jirajine

2019-10-11 21:17:42 +08:00 via Android

然后图片再经过反 OCR 处理，像图片验证码那样？
这不叫加密，不过用在国内通讯平台上也能有一定效果，但非常不可靠。

Kagari

2019-10-11 21:18:04 +08:00

加…密？？？

gavindexu

2019-10-11 21:19:49 +08:00 via iPhone

@areless 不，你不觉得。
我觉得：
在境内开展的活动，除了军方外，其他万物皆可视。

areless

2019-10-11 21:20:04 +08:00

@YamatoRyou 不是，混淆后图形防采集，机械 OCR 是没用的。如果用 AI 是有用的，但 AI 没有那么快去识破千万条的图片信息，并且建立索引搜索关键词。

@ZavierXu 不好，人家知道你在发信息的。而我只是一个家用摄像头、行车记录仪，我也不知道怎么回事。

0TSH60F7J2rVkg8t

2019-10-11 21:22:15 +08:00 via iPhone

这加密很容易破啊

1. 脏点数据

管你什么图片，发来就插入人眼不可识别的脏点数据，让你解码失败或者错误。

2. 特征定位

找到加密特征，并不需要完全解密，有特征直接屏蔽。

3. 拉入黑箱

不常见的图片，经常只聊图片的人，发出即黑箱，对方不可见。

4. 封号警告

太可疑的聊天人员触发封号，每次解封都特别麻烦，搞几次就没人用你的加密工具了。

areless

2019-10-11 21:23:10 +08:00

@gavindexu 我觉得军方动用不了如此算力去算每一张图。然后监控每一次访问，高频异常值的时候，就转换成 Google 的 10000*10000PX 的蒙娜丽莎给他。

niubee1

2019-10-11 21:28:25 +08:00

任何不走正道的方法都是异端

areless

2019-10-11 21:28:32 +08:00

@ahhui 图片处理领域的算法，比那些对称加密领域要领先很多，不像对称加密算法领域，是怎么回事呢?一种是感官上接近的模糊混淆，但人类能识别。另一种是机械的精确对撞，终会有解。

dioxide

2019-10-11 21:34:10 +08:00

感觉这只是一种编码方式啊, “加密”体现在哪里?

salamanderMH

2019-10-11 21:37:02 +08:00

想法不错

bzw875

2019-10-11 21:39:39 +08:00

别人说计算机也有民科我不信，直到我看到 LZ

areless

2019-10-11 21:39:45 +08:00

@richard1122 @dioxide 这种混淆不需要算法，这种混淆人类可识。这种混淆管理者可能识别不过来。假设我们用图形来通讯呢……我们是不是便能突破某些壁垒，现在 5G，带宽挺宽。

celeron533

2019-10-11 21:40:35 +08:00

数字水印、图像频域隐写了解下？

crella

2019-10-11 21:44:12 +08:00

经典回复：不要用技术来解决非技术问题。

linksgo2011

2019-10-11 21:44:37 +08:00

非常朴素的密码学观念。我在一篇博客聊过这个话题：

“在软件行业中，最有意思的是很多人对造轮子非常感兴趣（包括我），不过有一些轮子我不建议自己造。这就是加密算法，不止一个人在聊天中谈起对信息安全的看法时说，要是我开发一个自己的加密算法只有我自己的知道（甚至很多真的这么干了），肯定是天底下最安全的。这是一种非常朴素的信息安全认识，自己的创造的“加密算法”也只是根据特定规则对信息的混淆和变换，这甚至落后于凯撒密码。

现代密码学已经有大量的对称加密、非对称加密、HASH 公开算法，甚至建立了一套完整的通信信息安全基础设施（ PKI ），保证信息安全的是密匙而不是加密算法。与其闭门造车，不如选择 RSA 等大师们的成果。”

http://www.printf.cn/index.php/archives/software-standards.html

areless

2019-10-11 21:49:47 +08:00

@bzw875 民科的力量，你不懂。我常常看到有很多爱国志士用发图的方式逃避集权，我就觉得，哇……好使。比用现有函数的对称加密好使。什么私钥公钥 bip39 助记词，你倒是快速解决一下你发信息被管理层捕获到的问题啊?我想设计一款最厉害的加密（逃避监管）通讯软件。

singerll

2019-10-11 21:52:41 +08:00 via Android

图片不太好，可能会被识别，我建议转成 pdf 或者 cad

happyz90

2019-10-11 21:54:14 +08:00 via Android

不如直接用火星文？

delpo

2019-10-11 22:03:50 +08:00

@areless 首先,根据你的描述,你需要解决的是匿名 /监管问题,而不是加密问题,请把自己的目的明确再提问

aguesuka

2019-10-11 22:04:14 +08:00

还不如用方言

iyouth

2019-10-11 22:04:48 +08:00

还是太年轻......

FrankHB

2019-10-11 22:08:06 +08:00

跟监管比算力？
墙笑了……

tatsuteng

2019-10-11 22:10:47 +08:00

这...威胁模型先了解一下？

lscho

2019-10-11 22:12:17 +08:00 via Android

这不就是验证码吗。。。你知道图形验证码为啥现在都没人用了？因为现在识别图像所需算力完全没有你想的那么夸张。

而且不管你怎么混淆，肯定有一套算法，不加密的话，直接从数据层就可以得到你的数据，分分钟就解出来了，连图像识别都不用。

所以，你看，又回到了加密上。

lscho

2019-10-11 22:17:39 +08:00 via Android

回复完看见附言了，跟我说的一样。。“用一定算法生产的图片”，你怎么保证你这个算法不能被解开？你连加密算法都不信，你觉得自己设计的算法别人解不了？

Cytion

2019-10-11 22:22:51 +08:00 via Android

不要尝试叫醒一个装睡的人

Xs0ul

2019-10-11 22:26:16 +08:00

用图片发文字,本身就凭空增加了一个显著的特征. 只要有一个被发现,剩下的岂不是一锅端

areless

2019-10-11 22:28:41 +08:00

@lscho。。。图形的优势在加密学上一直是不容易破解的。为什么现在流行 GPU 去算了呢？这款“加密”通讯软件就叫 PDV(Piero da Vinci) chat

mengzhuo

2019-10-11 22:29:17 +08:00

看着加密进来，笑着出去的

hakono

2019-10-11 22:29:29 +08:00

其实楼主你花那么大力气搞这种没卵用的，还不如开发个自动给发送到 qq 上的信息使用 aes 或者 rsa 加密成密文，然后对方的 qq 接收到加密的数据后，对方的程序能自动读取密文并自动解密，呈现到独立窗口的软件来的现实

反正经过 aes 或者 rsa 加密的数据你不暴露秘钥，腾讯或者 zf 也没能力暴力破解你的密文

webshe11

2019-10-11 22:33:42 +08:00

areless

2019-10-11 22:35:35 +08:00

@hakono 假设客户端程序能解。解法写在前端里，不就是此地无银三百两吗？正因为很多图形我们程序解不了，或则得花力气去解，而人能够轻易识别。

Kagari

2019-10-11 22:35:38 +08:00

很好，请问如何用图片实现前向安全性？

ZRS

2019-10-11 22:37:51 +08:00

看乐了

wwbfred

2019-10-11 22:38:28 +08:00

这个其实不算作加密.加密的目的是在已知密文的条件下无法让非密钥持有者获得明文.
你这个思路是让第三方无法意识到密文的存在,本质上是对数据的加盐.
目前没有任何已知的算法可以仅靠加盐操作通过密码强度证明.
这就意味着攻击者拿到一定数量的纯加盐数据后可以在可接受的时间内得到明文.
于是这一算法的安全性完全建立在攻击者无法意识到密文存在的基础上,一旦意识到了就完蛋了.
最后你还是要用到现有加密算法来保证数据的隐秘性和可靠性.

lscho

2019-10-11 22:42:34 +08:00 via Android

@areless 人能轻易识别的，目前程序都能轻易识别。。。

areless

2019-10-11 22:49:03 +08:00

@Kagari 滤镜库有万种图片混淆算法随机 get，不传文字。每一个地区都向一个节点传图片，在全国几千个节点，每个节点合成 24 帧一分钟的影片，最终存入离岸服务器。然后每个节点都负责分发工作，冗余节点构架。离岸最终数据。因为图片反正都能看……载入一个变态点的滤镜库，不是传统的私钥密钥公钥结构，只是简单混淆，做到机不能解，人能解。

areless

2019-10-11 22:53:05 +08:00

@lscho 并不是这样的。人八九秒处理一条复杂图形的信息，就能够通讯了。机器算作 1 秒吧。一万个人一千万条图形信息，机器要多少秒呢？现在是机器处理文字实在太快，只要不用 0.00001 秒……

hakono

2019-10-11 23:06:47 +08:00

@areless ? 你这明明是理解错了

我说的是，qq 之外单独一个程序，专门负责从 qq 的窗口中抓取聊天内容或者发送信息
然后明文的聊天内容都交给那个程序来处理，要发送信息的话，明文写到程序的输入框内（或者写到 qq 里也行，程序拦截下信息就行），然后程序将你的明文加密成密文，代你通过 qq 发送出去
对方接收到加密的密文后，解密也是同理

qq 里只发送经过加密后的密文，也就是说所有聊天内容都是无规则的加密字符串
加密解密都是独立于 qq 的，只要不泄露秘钥，腾讯和 zf 能把你的密文怎么样？

hakono

2019-10-11 23:08:05 +08:00

@areless 以及这种程序其实并不难写，而且最好实现的方法是在 android 手机上，只需要一个 xposed 框架就能随意入侵 qq 的程序做任何你想做的事了

Xs0ul

2019-10-11 23:28:42 +08:00

@areless 你太低估机器的速度了.就看本站今天大佬分享的 repo, https://v2ex.com/t/608340, 在树梅派上跑人脸识别,一张图也就十几毫秒

mskf

2019-10-11 23:42:46 +08:00

lz 这么做的目的是为了在哪个环节防止泄密

qwx

2019-10-11 23:54:54 +08:00

我特地登上账号来回复楼主，想法不错，但是毫无用处，不如 GPG，监管要 key ？我把私钥完全销毁，你能抓我的人有什么用？打死我我都没法给你还原信息。用图片如果中途被采样怎么办，对称加密本来就不是逃避监管的好手段，隐写才是。

ilotuo

2019-10-12 00:00:56 +08:00

lz 牛逼。到时通讯软件禁止发图或者限量发图我就怪你

ilotuo

2019-10-12 00:02:56 +08:00

现在深度学习这么强大。你特征又这么明显，做个二分类网络轻松判断你的图片好吧。

areless

2019-10-12 00:07:54 +08:00 via Android

@hakono 加密通讯你这个方案比我的方案好，的确只要双方加密，扔个钥给对方就可以。可是注意到没有，我这方案的应用场景，论坛或者类似微博广场的 timeline~~~能看，却不能解析的很深，屏蔽搜索引擎又屏蔽了某些大数据程序型监管。
我说成了加密，其实是不能被轻易解析又防爬虫的通用型社区软件。而没有牺牲易用性的前提下。

@Xs0ul 那是特征点比对。。。普通程序解析，就像以前 ibm 的深蓝。现在的深度学习是耗电耗时的~~~深度学习 deepai 的 api 就那么几个，训练成熟的市面上有吗？深度学习能爬这玩意，得花时间及算力。但是人脸识别就是 ocr 一样的东西，有个识别率的问题，一错全错~~~换个狗头就不认识了。

@mskf 并不是不会泄密。但是，就像只能看到大象的腿看到某几条十条百条。你在该通讯系统内是无法截获这头大象的。现在的系统大部分都能轻易被搜索，轻易截获全部。在运营商也好，在某些地方也好。通过通讯旁路也好，主动去爬取也好。

@qwx 你说的方案在加密通讯是比这个要好。但我觉得这个是有用处的。你想想有天然的易读易用性及难以整体采样分析。

ipwx

2019-10-12 00:10:47 +08:00

行了，如果官方没有盯上你，你这做法就是多此一举。

如果官方盯上了你，你这做法还是多此一举。

james2013

2019-10-12 00:17:45 +08:00

应用宝的应用上架前,如果涉及到 im,就需要到公安网站进行安全评估.并做出自我承诺,比如负责人,什么措施,聊天记录保存一定的期限.
可能是楼主想法比较幼稚,这样做意义不大.
你这个 app 出事了,小事则进行整改,比如像小红书进行应用下架处理,这个也是需要自己对违规内容进行处理,也是需要做好配合.
大问题可能都进去吃免费的饭了.

areless

2019-10-12 00:28:11 +08:00 via Android

@ipwx 我说的是发图聊天巧妙的避开了监管。不容易被官方盯上~~~是有效的方法。没盯上我们更应该注重隐私不是吗

@james2013 那个~~~我们不是已经在境外论坛 V2EX 讨论这个问题了嘛。我觉得是有意义的，到了某些时候，我们记得转成图片再发。有很多因为发朋友圈拘留的呢

AlisaDestiny

2019-10-12 00:34:15 +08:00

你朋友用你的“加密”通信软件给你发了个文章让你帮忙打印下，于是你对着图片把文章重新敲了一遍再打印。
xwsl.

JJstyle

2019-10-12 00:38:37 +08:00 via iPhone

楼主重新定义了加密

Xs0ul

2019-10-12 00:53:15 +08:00

@areless 那帖子里都放了 github 源代码了, 怎么就成了特征点比对了

delpo

2019-10-12 01:12:34 +08:00

@areless #55 的意思应该是,如果你开发的 app 使用人少,那并没有监管机构会盯上你
如果大范围使用了,那你 app 用的什么原理也没有意义了,直接请你去喝茶就是了

其实如果你开发这样的 app,就像#56 说的那样,无法在国内市场上架,受众必然不会很多,到最后也跟各种开源 im 一样小范围使用,就又回到第一种情况,那这种情况下为何不用 pgp 呢

Raymon111111

2019-10-12 01:19:11 +08:00

这么成熟的 ocr 是假的吗?

(百度贴吧文字发不出去的东西, 换成图片一样经常挂

asuraa

2019-10-12 01:22:54 +08:00 via iPhone

其实没那么麻烦你不开源就行了

diferent

2019-10-12 01:27:50 +08:00

楼主勿怪,没有讽刺的意思,
但是看了你发的帖子和回复, 我觉得你毕业于二本或以下院校,不知道对不.

jhdxr

2019-10-12 01:38:09 +08:00

@areless 你太低估现在 AI 的性能和功能了。纯文字型的验证码，只要你人能识别出来的，机器也就几十毫秒的事情。你人识别不出来的（说的就是 google recapcha ），机器也很有可能能猜中。所以你看现在的验证码都在往理解上面去加强（比如选择 XX 物体，点击 XX 颜色的字之类的）。

当然，如果 LZ 发现了一个混淆方法，能够在让人还能看得懂的前提下，大幅降低机器的识别成功率。我觉得钱和名都不是问题。。。

areless

2019-10-12 01:54:33 +08:00 via Android

@jhdxr
真是高科技啊。的确快，新闻是这么写的只要 0.05 秒，详见此文（笑）
http://www.lancaster.ac.uk/staff/wangz3/publications/ccs18.pdf

@diferent
你说的都对，v2ex 从来不是什么高材生的乐园啊？ 08~09 年在 V2EX 招过人，收到简历是，一个大学肄业，一个还没毕业~~~

@Raymon111111
ocr 这么厉害

mskf

2019-10-12 01:55:53 +08:00

@areless 你意思是会泄密，但是不会全部泄密，也就是说，防止全部泄密。

那么你觉得一个 PGP 通讯系统在什么时候会部分泄密？

laike9m

2019-10-12 02:02:13 +08:00 via Android

我觉得可以

jhdxr

2019-10-12 02:19:39 +08:00

@areless GAN 不是新东西了。几年前腾讯就上了，当时效果相当显著，但后来不还是逐渐换了（人都没法识别了那还要它何用）。所以你的点是？

reus

2019-10-12 05:48:30 +08:00

你倒是做出来啊。

alphatoad

2019-10-12 08:13:52 +08:00 via iPhone

密码学都有民科了啊

yogogo

2019-10-12 08:38:18 +08:00

ipv6 通讯怎么，双方交换各自的 ipv6 地址，点对点通讯就行

wupher

2019-10-12 09:07:22 +08:00

嗯，这其实算加点噪音，并不能达到你想达到的目的。

服务器如果想监管其实还是有很多办法的。统一转成黑白，再进行明暗处理后，就可以进行 OCR 识别了。

LeeSeoung

2019-10-12 09:31:01 +08:00

渣浪的图片检测会检测图片上的文字是否有敏感词。如果有会屏蔽。。end

claymore94

2019-10-12 09:31:44 +08:00

同情楼主，加密这个事情要想好，想完整，不然槽点太多。可以看看我上一个发帖

doveyoung

2019-10-12 09:49:33 +08:00

这个，其实向 tg 学习一下不就行了？反正不给密钥。然后问题变成了密钥被泄露怎么办。如果有一种机制，能 5s10s 自动随机更新密钥，所有的节点参与维护这个机制，即使被拿到了密钥，也只能解密这段时间的内容，当然如果算法被破解了能计算出每个时间段的密钥也没啥用……说到这里，我好像想到了区块链+？？哈哈哈

youxiachai

2019-10-12 09:53:53 +08:00

"一定算法生产的图片"....
最后还不是绕回到加密算法了....
不要以为你换了一个壳我就认不得你了....

lucifer9

2019-10-12 09:59:24 +08:00

其实应用密码学这本书并不是很难读的啊

Todd_Leo

2019-10-12 11:00:23 +08:00

为什么不用端到端的 PGP 加密呢，就像邮件那样

cwbsw

2019-10-12 12:08:25 +08:00

楼主的想法真的很可笑吗？
这不就跟 VPN 不能用来科学上网一个道理吗？

Vinty

2019-10-12 13:52:57 +08:00

防止 ocr 的混淆算法很有实际意义啊，希望楼主能搞出来

nnnToTnnn

2019-10-12 14:17:42 +08:00

楼主，我给个提示，在 ORC 竞赛中，已经有结论了，人眼识别，没有 ORC 准确高效。

reCAPTCHA 之前就是采用楼主的想法，去解决防止 ocr 的混淆算法，最终随着现代机器学习的发展，基本上人眼能识别出来的，机器百分之百能识别。

muyumao

2019-10-12 14:21:52 +08:00

楼主的想法从技术上看很赞，但是实用性比较差，这种聊天软件国内不会允许使用的，因为不符合监管政策

Wassermelone

2019-10-12 15:33:59 +08:00

借楼有隐写相关工作经验的回复我下~价格好说

Qianyu

2019-10-12 16:10:47 +08:00

感觉楼主的想法其实不错，不过如其他人所说国内不会允许这种软件。

@youxiachai #77 已知正向转成图片的算法，不代表能从图片逆向推出文字

Citrus

2019-10-12 16:16:47 +08:00

看了每一条回复，包括楼主的附言。楼主一直在说机不能解人能解。机不能识别人能识别。
可是你说了这么多也没举个例子啊。。。从目前 OCR 对抗验证码的成果来看，我并不觉得你的混淆算法可以做到这点。。。

smallpython

2019-10-12 16:21:07 +08:00

不过这个想法不错, 可以设计那种阅后即焚的聊天工具

pkoukk

2019-10-12 16:34:09 +08:00

按我的理解，你想做的是，把文字转换成文字图片的形式发送对么？
那么你转换成的图片中，文字的字号、字体是否固定？如果固定的话，相对大小又是否固定？
如果以上的回答是肯定的，那么相同关键词对应的图片特征也是一致的
监管只需要对关键词所对应的图片特征进行识别即可，算力负担很小
其实目前微博已经采取特征的方式对可能裸露图片进行了识别和屏蔽，算力负担远比你想象中的更小

aqqwiyth

2019-10-12 17:18:55 +08:00

点对点没有毛病,问题是让所有人达成共识很难.....

比如自己写的 Fang 墙传输自己用很稳. 但是大批量推广就很容易死

msg7086

2019-10-12 18:09:05 +08:00

1. 逃避监管不是加密，是混淆。加密不需要逃避监管，因为监管的人根本不知道是什么东西。你这个是监管的人肉眼一看就知道是什么东西了，你想做的是让监管的人不来关心你是否需要监管，所以本质上是一种混淆。

2. 如果两个人之间频繁互相发送图片，或者一个群里大量通过图片进行聊天，本身就会因为过于可疑而触发人工监管。

我拿爬墙举个例子，以前 VxN 特征都非常强烈，但是加密功能很强，所以是属于「监管一看就知道你在用 VxN 但是他无法破解你通讯的内容」。现在我们用丝丝，程序设计的时候就特地加强了混淆，属于「监管无法判别你到底是爬墙还是正常流量」。而墙应对的方式也很简单，对于「无法判别是爬墙还是正规流量」的，一律当成可疑流量，也就是上面我说的第 2 点。

文字转换成图片这种技术，网上冲浪都快 20 年了会没有人想出来过？为什么现在没有流行，你想过原因吗。

lzxgh621

2019-10-12 18:36:21 +08:00

新华社每次直播某人的讲话时，都是一句发一条推送。
我曾经截图试图发到微信里吐槽，然而发不出去。

areless

2019-10-12 18:53:48 +08:00 via Android

@Todd_Leo 推特作为邮件的升级，也没有使用 pgp。

@nnnToTnnn 上面有论文自己看，别幻想什么能解一个简易有线条干扰弯曲字体的验证码，连几十像素的验证码都解不了，汉字加上多种字体及稍加干扰就目前技术能解才怪。gan 这部分，包括生成器与判别器的对抗，生成器总能生成人眼可以识别的文字，而判别器简直一摊糊涂~~~

现在搞技术的对 ocr 或者深度学习~机器学习抱有太多幻想。上面文章指出，深度学习在大量学习时间下还不及人类，而且像素的增加对于这些 ai 是致命的。机械学习几 px 偏差就错了

还有~有些几块钱一次的人工智能，有可能是人伪装的（笑）

jhdxr

2019-10-12 23:05:11 +08:00

@areless 别沉浸在自己的幻想里了，『生成器总能生成人眼可以识别的文字』，谷歌的文字验证码，你现在刷新几次能够正确输入一个？每次遇上都要输个好多次才能过的验证码，明显不合格。

areless

2019-10-13 08:56:03 +08:00 via Android

@jhdxr 你看那文章，还没到 google 验证呢，第三个就差不多挂掉了。仔细看文章。
再给你一篇文章
https://baijiahao.baidu.com/s?id=1646884927969073605
下面两个数值 55.4%和 77.3%的准确率。你再看文字里的图像。。。

nnnToTnnn

2019-10-14 09:00:40 +08:00

@areless 最早 reCAPTCHA 就是采用楼主说的方法，进行验证干扰，然后进行人机识别。

在 2008 年的时候视觉算法已经可以根据转二值化，然后去干扰线做到精准的识别。

例如这种验证码，但是麻烦的是需要配对应的字库

但是在 2019 年的时候，大部分都采用机器学习进行训练，也就是说指需要人进行把汉字进行分类就行了。

例如早期人工识别文字然后进行分类，自然就可以很好的识别出来内容。

你看看现在的 Google 都不往图片上面考虑了，学术界通认的事实

人眼识别 < 机器识别

wlbyg888

2021-07-29 13:05:56 +08:00 via Android

@YamatoRyou 正解，tx 的识图技术强大到离谱