复杂背景的验证码识别破解 以Discuz的动画验证码为例。

所属分类: 网络安全 / 安全其它 阅读数: 211
收藏 0 赞 0 分享
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路



首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的







那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值



其余的都可以认为是噪音,我们对每个峰值进行分割,得到如下图片



你看这样就把单个颜色图片分割出来了,接下来就是找到图片中除去黑色和白色后的图片



然后进行灰化处理,阀值处理,降噪,得到



接着根据边界检测出来的最左侧x位置,来排序字母顺序



接下来的事情就轻车熟路了,把图片转成标准模板,通过少量学习就达到了95%以上的识别率

c:15 j:8 8:7 t:9 9:4 x:7 4:6 2:4 h:7 f:8 e:18 b:5 y:3 k:4 w:3 g:5 3:5 7:6 r:2 m:3 q:4 v:2 p:3 6:2
以上数据表示 c学习15次 j学习8次…



只要字符不粘连,大部分验证码干扰技术都是可以有办法,所以为什么google验证码看起来很简单,但是没有人能够很好的破解它得原因。

补充,
rise在留言中发现有一些字符加入杂点的问题,由于这种验证码不是很普遍,稍微做了研究


CY3E 这个图片3字中有杂点,其他没有,按照文章中介绍的办法,怎么知道这个3不是像其他颜色杂点一样的图片呢?


我觉得需要加入一个步骤,就是对每次过滤颜色生成出来的图片,进行填充
找到3的杂点原图:


然后我们进行算法填充



这个图片与其他全部是杂点的图片之间的差别进行过滤,我考虑可以通过以下方法:
1、连贯点的宽度
2、连贯点的个数
这样剩下的就只剩下CY3E的过滤后的图片

至于字符倾斜的问题,我觉得完全可以在机器学习过程中,我们自己旋转正在学习的图片一定角度,例如从-10到+10度,只不过这样的学习库会大一些,但是就10个数字的验证码来说,这点性能损失应该可以忽略不计。
更多精彩内容其他人还在看

如何禁止本地拖拽文件上传、禁止网页文件上传、禁止拖动文件到网盘、禁止拖拽文件到QQ

拖拽文件是我们经常用到的一个功能,可以方便地把电脑文件拖拽到邮件附件、网盘、QQ等聊天软件里面,实现轻松上传文件或发送文件的目的
收藏 0 赞 0 分享

男子想代练赚钱反沉迷网游 靠盗窃买游戏装备

这篇文章主要介绍了男子想代练赚钱反沉迷网游 靠盗窃买游戏装备的相关资料,大势至公司可以独家提供从局域网网络行为管理、电脑资料防止泄密管控和信息安全防护一站式解决方案,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

电脑文件加密软件哪个好、文件夹加密软件排行榜、磁盘加密软件哪个好

这篇文章主要介绍了电脑文件加密软件哪个好、文件夹加密软件排行榜、磁盘加密软件哪个好的相关资料,无论是在单位还是个人电脑中,我们经常会在电脑上存储一些重要的文件,如何保护这些文件安全,下面就一起来看一下
收藏 0 赞 0 分享

业内专家谈"网上谍影":政企单位如何打赢无声的信息战?

随着互联网的广泛应用,互联网逐渐成为了境外间谍情报机关窃取我国家机密的重要渠道,危害我国家安全的事件时有发生。维护网络安全和国家秘密安全,是各级涉密单位、涉密人员乃至全社会的共同责任,下面就一起来了解一下如何帮助政企单位构建安全体系的方法
收藏 0 赞 0 分享

如何把不良信息屏蔽在校园网络之外?这事让校长很伤脑筋

网络既有可爱的一面,又有可怕的一面,不良的网站,不良的信息总会时不时的出现,不良信息屏蔽系统是校园网络信息安全的重要部分,主要功能是屏蔽网上不良信息,本文就来介绍一下如何有效的屏蔽不良信息,就跟小编一起来了解一下吧
收藏 0 赞 0 分享

《解除好友2》:我们离暗网有多远

在这个世界上存在着许多你根本不知道的危险角落,和一些你不敢想象的罪恶行径。小编今天带大家探讨一下罪恶天堂——暗网,一个比你想象中恐怖100倍的互联网世界。感兴趣的可以了解一下
收藏 0 赞 0 分享

迅雷链张慧勇:区块链安全威胁及防护思路分析

迅雷链开放平台研发负责人张慧勇对区块链安全问题的特点做了详细解释,介绍了目前区块链所面临的安全问题现状、区块链安全问题的特点,以及迅雷链是如何做安全的底层设计的,感兴趣的可以一起来了解一下
收藏 0 赞 0 分享

迅雷链技术专家深度剖析:区块链信任之源的秘密

区块链无疑是2018年的热门技术。虽然,区块链技术最受关注的应用主要在金融服务领域,其实它越来越多地影响着各个行业,迅雷链底层研发工程师张骁就区块链安全问题和密码学的关系做了主题分享,感兴趣的可以一起来了解一下
收藏 0 赞 0 分享

企业数据防泄密之举措:电脑文件加密软件还是电脑数据防泄密系统?

现在很多单位局域网都是无纸化办公,公司很多商业机密信息也是以电子文档的方式存储,那么电脑文件加密软件还是电脑数据防泄密系统?下面就跟随小编一起来了解一下
收藏 0 赞 0 分享

微信域名防封技术 微信域名总是被屏蔽被拦截该如何解决

身在网站要想在微信端被使用,多多少少都会有预防被拦截,是专门为运营网站和公众号的运营者一个研究的工具几十你是正常网站,也是公司企业备案,照样也会被拦截,下面 给大家带来了微信域名总是被屏蔽被拦截该如何解决,一起看看吧
收藏 0 赞 0 分享
查看更多