复杂背景的验证码识别破解 以Discuz的动画验证码为例。

所属分类: 网络安全 / 安全其它 阅读数: 151
收藏 0 赞 0 分享
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路



首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的







那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值



其余的都可以认为是噪音,我们对每个峰值进行分割,得到如下图片



你看这样就把单个颜色图片分割出来了,接下来就是找到图片中除去黑色和白色后的图片



然后进行灰化处理,阀值处理,降噪,得到



接着根据边界检测出来的最左侧x位置,来排序字母顺序



接下来的事情就轻车熟路了,把图片转成标准模板,通过少量学习就达到了95%以上的识别率

c:15 j:8 8:7 t:9 9:4 x:7 4:6 2:4 h:7 f:8 e:18 b:5 y:3 k:4 w:3 g:5 3:5 7:6 r:2 m:3 q:4 v:2 p:3 6:2
以上数据表示 c学习15次 j学习8次…



只要字符不粘连,大部分验证码干扰技术都是可以有办法,所以为什么google验证码看起来很简单,但是没有人能够很好的破解它得原因。

补充,
rise在留言中发现有一些字符加入杂点的问题,由于这种验证码不是很普遍,稍微做了研究


CY3E 这个图片3字中有杂点,其他没有,按照文章中介绍的办法,怎么知道这个3不是像其他颜色杂点一样的图片呢?


我觉得需要加入一个步骤,就是对每次过滤颜色生成出来的图片,进行填充
找到3的杂点原图:


然后我们进行算法填充



这个图片与其他全部是杂点的图片之间的差别进行过滤,我考虑可以通过以下方法:
1、连贯点的宽度
2、连贯点的个数
这样剩下的就只剩下CY3E的过滤后的图片

至于字符倾斜的问题,我觉得完全可以在机器学习过程中,我们自己旋转正在学习的图片一定角度,例如从-10到+10度,只不过这样的学习库会大一些,但是就10个数字的验证码来说,这点性能损失应该可以忽略不计。
更多精彩内容其他人还在看

大势至电脑文件安全管理软件、电脑资料防止泄密管控软件和计算机文件防泄密软件V12版

这篇文章主要介绍了大势至电脑文件安全管理软件、电脑资料防止泄密管控软件和计算机文件防泄密软件V12版本发布,彻底防止计算机泄密重要文件的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

如何把文件夹设置密码、怎样在电脑文件夹加密、怎样设置文件夹加密的方法

这篇文章主要介绍了如何把文件夹设置密码、怎样在电脑文件夹加密、怎样设置文件夹加密的方法,需要的朋友可以参考下
收藏 0 赞 0 分享

电脑文档安全管理系统之企业商业机密如何保护、如何保护公司商业秘密

这篇文章主要为大家详细介绍了电脑文档安全管理系统之企业商业机密如何保护,如何保护公司商业秘密,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

大势至公司文件防泄密方案、企业防泄密软件网络版的管理端与客户端连接设置的方法

这篇文章主要为大家详细介绍了大势至公司文件防泄密方案、企业防泄密软件网络版的管理端与客户端连接设置的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

如何实现每次访问共享文件都需要输入账户和密码 远程访问共享文件需要用户密码验证

如何使得用户每次访问共享文件都需要输入密码呢?下面脚本之家小编给大家带来了如何实现每次访问共享文件都需要输入账户和密码、怎样设置远程访问共享文件需要用户密码验证,感兴趣的朋友一起看看吧
收藏 0 赞 0 分享

共享文件如何禁止下载、共享文件防复制、禁止复制共享文件内容、禁止拖动共享文件的行

这篇文章主要介绍了共享文件如何禁止下载、共享文件防复制、禁止复制共享文件内容、禁止拖动共享文件的行为的相关资料,非常具有实用价值,需要的朋友可以参考下
收藏 0 赞 0 分享

文件夹共享给指定电脑、文件夹共享给指定用户、文件夹共享给特定用户的方法

这篇文章主要介绍了文件夹共享给指定电脑、文件夹共享给指定用户、文件夹共享给特定用户的方法的相关资料,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

公司数据防泄密方案之如何防止电脑文件泄露、公司电脑防止资料泄露?

公司日常办公都是通过计算机网络进行,员工日常工作中形成的重要文件都是存储在各自的电脑上,那么公司如何防止商业机密泄露、防止电脑资料泄露呢?本文就来详细的介绍一下
收藏 0 赞 0 分享

复杂背景的验证码识别破解 以Discuz的动画验证码为例。

对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路
收藏 0 赞 0 分享

收集的比较齐全的黑链代码大全

这么多黑链代码,到底那种黑链代码的写法最好呢。本尊现在给各位朋友一些建议。
收藏 0 赞 0 分享
查看更多