2021/7/3爬虫第三十二次课(反反爬措施二之突破行为验证,opencv)

本文主要是介绍2021/7/3爬虫第三十二次课(反反爬措施二之突破行为验证,opencv),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 一、图形验证码(实现上次的12306突破验证码)
    • 二、​opencv简单使用(这里用了其美化照片功能)
    • 三、行为验证
    • 四、拓展

一、图形验证码(实现上次的12306突破验证码)

12306图片验证码的实现
​
解决方案: selenium(鼠标行为链) + 打码平台
​
思路:
通过selenium来加载登录页面,获取验证码图片。我就可以把验证码图片交给超级鹰打码平台进行处理。让其给我返回这张验证码正确的坐标值。拿到正确的坐标值之后去点击图片
​
实现步骤
第一步 使用selenium加载登录页面
第二步 对页面进行保存(截屏,通过selenium)
第三步 截取12306图片验证码 (通过selenium)
第四步 交给超级鹰打码平台进行识别 返回正确的坐标值
第五步 根据正确的坐标值进行点击

补充:
from PIL import Image:可以保存图片,截取图片
重点源代码:

1.裁剪部分需要包含4个坐标的元组
# 进行对12306图片验证码的裁剪
# 1 定位图片
code_img_element = driver.find_element_by_class_name('imgCode')#img标签
# 2 获取图片的左上角坐标值
location = code_img_element.location # location返回值是个字典 左上角坐标值
# 3 获取图片的宽和高
size = code_img_element.size # size也是一个字典 图片的宽和高
# 4 获取左上角和右下角的坐标值(元组)
rangle = (int(location['x']),int(location['y']),int(location['x']+size['width']),int(location['y']+size['height']))
i = Image.open('code.png')
code_img_name = 'yzm.png'
frame = i.crop(rangle) # crop() 根据指定区域进行裁剪  PIL
frame.save(code_img_name)
2.
#解析result#219,94|81,78|159,16|241,131
all_lst = [] # 存储要被点击的坐标值 [[],[]]
if '|' in result:lst1 = result.split('|')count1 = len(lst1)for i in range(count1):xy_lst = []x = int(lst1[i].split(',')[0])y = int(lst1[i].split(',')[1])xy_lst.append(x)xy_lst.append(y)all_lst.append(xy_lst)
else:x = int(result.split(',')[0])y = int(result.split(',')[1])xy_lst = []xy_lst.append(x)xy_lst.append(y)all_lst.append(xy_lst)

二、​opencv简单使用(这里用了其美化照片功能)

简单介绍:

# opencv 图像处理框架
# 1 跨平台性(windows ios linux android...)
# 2 跨语言(Java C/C++ Python Ruby oc swift..)
# 3 支持功能丰富(opencv)
# 4 稳定、性能高(1999年-至今 intel)
# 5 BAT公司 做一些ai领域
# 6 安装 pip install opencv-python

opencv
https://docs.opencv.org/3.0-beta/doc/py_tutorials/py_tutorials.html(参考文档)

import cv2
# 实现图片美颜效果
# 1 加载图片
image = cv2.imread('old_pic.jpg')
# 2 实现图片美颜效果value值越大美颜效果越明显 反之越小
value = 25
imgage_dst = cv2.bilateralFilter(image,value,value*2,value/2)# 生成一张图片
cv2.imwrite('new_pic.jpg',imgage_dst)# # 3 创建一个窗口
# cv2.namedWindow('image')
# # 4 展示窗口
# cv2.imshow('image',imgage_dst)
# # 5 窗口等待
# cv2.waitKey(0)#0或不填,则为一直等待
# # 6 销毁窗口
# cv2.destroyAllWindows()

三、行为验证

在这里插入图片描述

解决方案: selenium(鼠标行为链) + 算法
原理:完全模拟人的行为,按住滑块,拖动到目标缺口位置
​
思路:
我们将目标图片和目标缺口的距离分成2部分。前面一部分我们就刷的一下拖过去。后面一部分 我们可以先匀加速然后在匀减速
按住拖动按钮 拖动到目标缺口 松开
​
后面的一段速度代码需要用算法来实现

重要源代码:

1.算法部分
def get_tracks(distance):'''拿到移动轨迹,模仿人的行为,先匀速后减速匀加速运动公式:1 v=v0+at2 s=v0t+½at²'''# 初速度v = 0# 单位时间为0.3s来统计轨迹,轨迹即0.3s内的位移t = 0.3# 位置/轨迹列表,列表内的一个元素代表0.3s的位移tracks = [] # 保存的是匀加速和匀减速的距离# 当前的位移current = 0# 到达mid值开始减速mid = distance*4/5while current < distance:if current < mid:# 加速度越小,单位时间的位移越小,模拟的轨迹就越多越详细a = 2else:a = -3# 初速度v0 = v# 0.3秒内的位移s = v0*t+0.5*a*(t**2)# 当前的位置current += s# 添加轨迹到列表tracks.append(round(s))# 速度已达到v 该速度作为下次的初速度v = v0 + a*treturn tracks
2.
#破解行为验证
# 安装开始滑动的按钮 先移动180个像素
start_btn = driver.find_element_by_xpath('//*[@id="tcaptcha_drag_button"]')
time.sleep(2)
ActionChains(driver).click_and_hold(on_element=start_btn).perform()ActionChains(driver).move_to_element_with_offset(to_element=start_btn,xoffset=180,yoffset=0).perform()# 调用工具函数来移动剩下的距离
tracks = get_tracks(28)
for track in tracks:# move_by_offset() 鼠标从当前的位置移动多少距离ActionChains(driver).move_by_offset(xoffset=track,yoffset=0).perform()
time.sleep(1)
# 释放鼠标
ActionChains(driver).release().perform()

四、拓展

找工作核心点
简历(体现出你的优势 扬长避短)
手机录音 看看自己哪里没有做好
​
先做个自我介绍 流畅一些
​
时间: 
简历内容
1 联系方式(注意)
2 邮箱(别写QQ邮箱 163的邮箱)
3 学历(随机应变)
4 专业(大专及以上 99.9% 计算机专业 你就别写专业了)
5 技能(1 技能有条理性 2 写一些市面上比较热的技术opecv 3 准备)
6 项目(简历 )

这篇关于2021/7/3爬虫第三十二次课(反反爬措施二之突破行为验证,opencv)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/361164

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

黑神话,XSKY 星飞全闪单卷性能突破310万

当下,云计算仍然是企业主要的基础架构,随着关键业务的逐步虚拟化和云化,对于块存储的性能要求也日益提高。企业对于低延迟、高稳定性的存储解决方案的需求日益迫切。为了满足这些日益增长的 IO 密集型应用场景,众多云服务提供商正在不断推陈出新,推出具有更低时延和更高 IOPS 性能的云硬盘产品。 8 月 22 日 2024 DTCC 大会上(第十五届中国数据库技术大会),XSKY星辰天合正式公布了基于星

opencv 滚动条

参数介绍:createTrackbar( trackbarname , "hello" , &alpha_slider ,alpha_max ,  on_trackbar )  ;在标签中显示的文字(提示滑动条的用途) TrackbarName创建的滑动条要放置窗体的名字 “hello”滑动条的取值范围从 0 到 alpha_max (最小值只能为 zero).滑动后的值存放在

android-opencv-jni

//------------------start opencv--------------------@Override public void onResume(){ super.onResume(); //通过OpenCV引擎服务加载并初始化OpenCV类库,所谓OpenCV引擎服务即是 //OpenCV_2.4.3.2_Manager_2.4_*.apk程序包,存

C++ | Leetcode C++题解之第393题UTF-8编码验证

题目: 题解: class Solution {public:static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num &

Python3 BeautifulSoup爬虫 POJ自动提交

POJ 提交代码采用Base64加密方式 import http.cookiejarimport loggingimport urllib.parseimport urllib.requestimport base64from bs4 import BeautifulSoupfrom submitcode import SubmitCodeclass SubmitPoj():de

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

easyui同时验证账户格式和ajax是否存在

accountName: {validator: function (value, param) {if (!/^[a-zA-Z][a-zA-Z0-9_]{3,15}$/i.test(value)) {$.fn.validatebox.defaults.rules.accountName.message = '账户名称不合法(字母开头,允许4-16字节,允许字母数字下划线)';return fal

easyui 验证下拉菜单select

validatebox.js中添加以下方法: selectRequired: {validator: function (value) {if (value == "" || value.indexOf('请选择') >= 0 || value.indexOf('全部') >= 0) {return false;}else {return true;}},message: '该下拉框为必选项'}