Python模拟登陆万能法之-解决selenium被封锁

2023-12-29 06:08

本文主要是介绍Python模拟登陆万能法之-解决selenium被封锁,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天分享一下解决方案。就是通过让selenium来执行javascript命令,来避开封锁。(此处应该有掌声)

文章分为三个部分。 1. 介绍如果使用在selenium中使用javascript命令。 2. 用示例介绍具体的使用方法。此处用“淘宝”和“知乎”(可怜的知乎,又要被爬了)作为示例。3. 分享给大家给一些方便的javascript命令。例如如何用selenium点击一个特定的区域。

更多Python视频、源码、资料加群683380553免费获取

  1. 如何在selenium中使用javascript

访问这里了解如何编写javascript命令

  • 构建webdriver
from selenium import webdriver
chromePath = r'D:\Python Program\chromedriver.exe'
wd = webdriver.Chrome(executable_path= chromePath) #构建浏览器
  • 执行单行javascript代码。例:已知‘id’,向表格里注入用户名
try:wd.execute_script("document.getElementById('id').value='用户名';")
except:pass  
  • 执行多行javascript代码。例:用javascript注入js文件
javacriptCode = '''
var scriptElt = document.createElement('script');
scriptElt.type = 'text/javascript';
scriptElt.src = jsFile;
document.getElementsByTagName('head')[0].appendChild(scriptElt);
'''
try:wd.execute_script(javacriptCode)
except:pass
  • 为什么使用Try / Except 语句?

执行javascript代码时很多情况python会报错,但往往代码却可以被正确的执行。加上Try / Except来保护程序的执行。

 

2. 示例

  • 知乎模拟登陆(微博入口)
from selenium import webdriver
wd = webdriver.Chrome(executable_path = r'D:\Python Program\chromedriver.exe')
#打开知乎首页    
wd.get('https://www.zhihu.com/')
#进入登陆页面
wd.find_element_by_xpath('//*[@id="root"]/div/main/div/div[2]/div/div/div/div[1]/div/div[1]/div[2]/button[1]').click()
#点击社交网络账号登陆
wd.find_element_by_xpath('/html/body/div[4]/div/span/div/div[2]/div/div/div/div[2]/div[1]/form/div[5]/span[5]/button').click()
#点击微博登陆
wd.find_element_by_xpath('/html/body/div[4]/div/span/div/div[2]/div/div/div/div[2]/div[1]/form/div[5]/span[5]/span/button[2]').click()#输入微博账号,将value 里面的值换成你的微博账号。
try:wd.execute_script("document.getElementById('userId').value='我的微博账号';")
except:pass#输入微博密码, 将value 里面的值换成你的微博密码。
try:wd.execute_script("document.getElementById('passwd').value='我的微博密码)';")
except:pass#点击登陆按钮
wd.find_element_by_xpath('//*[@id="outer"]/div/div[2]/form/div/div[2]/div/p/a[1]').click()
#点击允许访问按钮
wd.find_element_by_id('//*[@id="outer"]/div/div[2]/div/div[2]/div[2]/p/a[1]').click()#登陆完成
  • 示例2 淘宝模拟登陆(微博入口)
from selenium import webdriver
wd = webdriver.Chrome(executable_path = r'D:\Python Program\chromedriver.exe')
wd.get('https://login.taobao.com/')
wd.find_element_by_class_name('weibo-login').click() #点击通过微博登陆淘宝#输入微博账号,将value的值改为你自己的微博账号。
try: wd.execute_script("document.querySelector('#pl_login_logged > div > div:nth-child(2) > div > input').value='username';")
except:pass
#输入微博密码,将value的值改为你自己的微博密码。
try:wd.execute_script("document.querySelector('#pl_login_logged > div > div:nth-child(3) > div > input').value='password';")
except:pass
#点击登陆按钮
wd.find_element_by_xpath('//*[@id="pl_login_logged"]/div/div[7]/div[1]/a/span').click()

3. 方便的javascript命令

  • 根据坐标,命令selenium点击特定位置。有的时候很难定位一个位置,我们可以用坐标这样的绝对位置来定位。
#例如点击屏幕上 (271,100)这个位置
wd.execute_script("document.elementFromPoint(271, 100).click();")

这篇关于Python模拟登陆万能法之-解决selenium被封锁的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/548548

相关文章

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Mysql如何解决死锁问题

《Mysql如何解决死锁问题》:本文主要介绍Mysql如何解决死锁问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录【一】mysql中锁分类和加锁情况【1】按锁的粒度分类全局锁表级锁行级锁【2】按锁的模式分类【二】加锁方式的影响因素【三】Mysql的死锁情况【1

一文带你搞懂Python中__init__.py到底是什么

《一文带你搞懂Python中__init__.py到底是什么》朋友们,今天我们来聊聊Python里一个低调却至关重要的文件——__init__.py,有些人可能听说过它是“包的标志”,也有人觉得它“没... 目录先搞懂 python 模块(module)Python 包(package)是啥?那么 __in

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

SpringBoot内嵌Tomcat临时目录问题及解决

《SpringBoot内嵌Tomcat临时目录问题及解决》:本文主要介绍SpringBoot内嵌Tomcat临时目录问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录SprinjavascriptgBoot内嵌Tomcat临时目录问题1.背景2.方案3.代码中配置t

Python实现特殊字符判断并去掉非字母和数字的特殊字符

《Python实现特殊字符判断并去掉非字母和数字的特殊字符》在Python中,可以通过多种方法来判断字符串中是否包含非字母、数字的特殊字符,并将这些特殊字符去掉,本文为大家整理了一些常用的,希望对大家... 目录1. 使用正则表达式判断字符串中是否包含特殊字符去掉字符串中的特殊字符2. 使用 str.isa

python中各种常见文件的读写操作与类型转换详细指南

《python中各种常见文件的读写操作与类型转换详细指南》这篇文章主要为大家详细介绍了python中各种常见文件(txt,xls,csv,sql,二进制文件)的读写操作与类型转换,感兴趣的小伙伴可以跟... 目录1.文件txt读写标准用法1.1写入文件1.2读取文件2. 二进制文件读取3. 大文件读取3.1

使用Python实现一个优雅的异步定时器

《使用Python实现一个优雅的异步定时器》在Python中实现定时器功能是一个常见需求,尤其是在需要周期性执行任务的场景下,本文给大家介绍了基于asyncio和threading模块,可扩展的异步定... 目录需求背景代码1. 单例事件循环的实现2. 事件循环的运行与关闭3. 定时器核心逻辑4. 启动与停

基于Python实现读取嵌套压缩包下文件的方法

《基于Python实现读取嵌套压缩包下文件的方法》工作中遇到的问题,需要用Python实现嵌套压缩包下文件读取,本文给大家介绍了详细的解决方法,并有相关的代码示例供大家参考,需要的朋友可以参考下... 目录思路完整代码代码优化思路打开外层zip压缩包并遍历文件:使用with zipfile.ZipFil