selenium+Chrome滑动验证码破解二(某某网站)

所属分类: 脚本专栏 / python 阅读数: 440
收藏 0 赞 0 分享

具体详情见代码,研究网站,随便输入手机号点击获取验证码

在自己写代码前参考了一批博客,是把所有验证码图片截取所有验证码图片保存在本地,再对比,感觉方法不行,所以自己写了个破解方法,通过js修改css直接抓取完整图片,因为上一篇写了B站,这里就不一一分析了,直接上代码:

破解成功界面

完整代码:

# -*- coding:utf-8 -*-
'''
研究网站: https://account.ch.com/NonRegistrations-Regist
滑块验证码也分两种:
  1.直接给缺口图片,先滑动到缺口找到完整验证码图片,对比有缺口的验证码图片,然后计算缺口坐标,再利用selenium移动按钮到指定位置
  2.直接给原图,缺口需要点击出现,直接保存原图,然后对比
'''
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains
from lxml.html import etree
from PIL import Image
from time import sleep
import re, requests
from urllib.request import urlretrieve
from bs4 import BeautifulSoup
 
class SliderVerificationCode(object):
  def __init__(self): # 初始化一些信息
    self.left = 60 # 定义一个左边的起点 缺口一般离图片左侧有一定的距离 有一个滑块
    self.url = 'https://account.ch.com/NonRegistrations-Regist'
    self.chromedriverPath = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe"
    self.driver = webdriver.Chrome(executable_path=self.chromedriverPath)
    self.wait = WebDriverWait(self.driver, 20) # 设置等待时间20秒
    self.phone = "18516544488"
 
  def input_name_password(self): # 输入手机号
    self.driver.get(self.url)
    self.driver.maximize_window()
    self.inputphone = self.wait.until(EC.presence_of_element_located((By.NAME, 'phoneNumberInput')))
    self.inputphone.send_keys(self.phone)
 
 
  def click_login_button(self): # 点击登录按钮,出现验证码图片
    login_button = self.wait.until(EC.element_to_be_clickable((By.ID, 'getDynamicPwd')))
    login_button.click()
    sleep(1)
 
  def get_geetest_image(self): # 获取验证码图片
    # print(self.driver.page_source)
    gapimg = self.wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_bg')))
    sleep(2)
    gapimg.screenshot(r'./captcha1.png')
    # 通过js代码修改标签样式 显示图片2
    js = 'var change = document.getElementsByClassName("geetest_canvas_fullbg");change[0].style = "display:block;"'
    self.driver.execute_script(js)
    sleep(2)
    fullimg = self.wait.until(
      EC.presence_of_element_located((By.CLASS_NAME, 'geetest_canvas_fullbg')))
    fullimg.screenshot(r'./captcha2.png')
 
  def is_similar(self, image1, image2, x, y):
    '''判断两张图片 各个位置的像素是否相同
    #image1:带缺口的图片
    :param image2: 不带缺口的图片
    :param x: 位置x
    :param y: 位置y
    :return: (x,y)位置的像素是否相同
    '''
    # 获取两张图片指定位置的像素点
    pixel1 = image1.load()[x, y]
    pixel2 = image2.load()[x, y]
    # 设置一个阈值 允许有误差
    threshold = 60
    # 彩色图 每个位置的像素点有三个通道
    if abs(pixel1[0] - pixel2[0]) < threshold and abs(pixel1[1] - pixel2[1]) < threshold and abs(
        pixel1[2] - pixel2[2]) < threshold:
      return True
    else:
      return False
 
  def get_diff_location(self): # 获取缺口图起点
    captcha1 = Image.open('captcha1.png')
    captcha2 = Image.open('captcha2.png')
    for x in range(self.left, captcha1.size[0]): # 从左到右 x方向
      for y in range(captcha1.size[1]): # 从上到下 y方向
        if not self.is_similar(captcha1, captcha2, x, y):
          return x # 找到缺口的左侧边界 在x方向上的位置
 
  def get_move_track(self, gap):
    track = [] # 移动轨迹
    current = 0 # 当前位移
    # 减速阈值
    mid = gap * 4 / 5 # 前4/5段加速 后1/5段减速
    t = 0.2 # 计算间隔
    v = 0 # 初速度
    while current < gap:
      if current < mid:
        a = 3 # 加速度为+3
      else:
        a = -3 # 加速度为-3
      v0 = v # 初速度v0
      v = v0 + a * t # 当前速度
      move = v0 * t + 1 / 2 * a * t * t # 移动距离
      current += move # 当前位移
      track.append(round(move)) # 加入轨迹
    return track
 
  def move_slider(self, track):
    slider = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '.geetest_slider_button')))
    ActionChains(self.driver).click_and_hold(slider).perform()
    for x in track: # 只有水平方向有运动 按轨迹移动
      ActionChains(self.driver).move_by_offset(xoffset=x, yoffset=0).perform()
    sleep(1)
    ActionChains(self.driver).release().perform() # 松开鼠标
 
  def main(self):
    self.input_name_password()
    self.click_login_button()
    self.get_geetest_image()
    gap = self.get_diff_location() # 缺口左起点位置
    gap = gap - 6 # 减去滑块左侧距离图片左侧在x方向上的距离 即为滑块实际要移动的距离
    track = self.get_move_track(gap)
    print("移动轨迹", track)
    self.move_slider(track)
 
 
if __name__ == "__main__":
  springAutumn = SliderVerificationCode()
  springAutumn.main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

更多精彩内容其他人还在看

Python实现按学生年龄排序的实际问题详解

这篇文章主要给大家介绍了关于Python实现按学生年龄排序实际问题的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面跟着小编来一起学习学习吧。
收藏 0 赞 0 分享

Python开发的HTTP库requests详解

Requests是用Python语言编写,基于urllib,采用Apache2 Licensed开源协议的HTTP库。它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。Requests的哲学是以PEP 20 的习语为中心开发的,所以它比urllib更加P
收藏 0 赞 0 分享

Python网络爬虫与信息提取(实例讲解)

下面小编就为大家带来一篇Python网络爬虫与信息提取(实例讲解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

在python3环境下的Django中使用MySQL数据库的实例

下面小编就为大家带来一篇在python3环境下的Django中使用MySQL数据库的实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

Python 3.x读写csv文件中数字的方法示例

在我们日常开发中经常需要对csv文件进行读写,下面这篇文章主要给大家介绍了关于Python 3.x读写csv文件中数字的相关资料,文中通过示例代码介绍的非常详细,对大家具有一定的参考学习价值,需要的朋友们下面跟着小编来一起学习学习吧。
收藏 0 赞 0 分享

Python实现解析Bit Torrent种子文件内容的方法

这篇文章主要介绍了Python实现解析Bit Torrent种子文件内容的方法,结合实例形式分析了Python针对Torrent文件的读取与解析相关操作技巧与注意事项,需要的朋友可以参考下
收藏 0 赞 0 分享

Python实现文件内容批量追加的方法示例

这篇文章主要介绍了Python实现文件内容批量追加的方法,结合实例形式分析了Python文件的读写相关操作技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

Python简单实现自动删除目录下空文件夹的方法

这篇文章主要介绍了Python简单实现自动删除目录下空文件夹的方法,涉及Python针对文件与目录的读取、判断、删除等相关操作技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

简单学习Python多进程Multiprocessing

这篇文章主要和大家一起简单的学习Python多进程Multiprocessing ,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
收藏 0 赞 0 分享

Python导入模块时遇到的错误分析

这篇文章主要给大家详细解释了在Python处理导入模块的时候出现错误以及具体的情况分析,非常的详尽,有需要的小伙伴可以参考下
收藏 0 赞 0 分享
查看更多