爬虫与反爬之艺龙反爬(code值的生成,下,算法篇)

2023-10-22 08:40
文章标签 算法 生成 code 爬虫 艺龙

本文主要是介绍爬虫与反爬之艺龙反爬(code值的生成,下,算法篇),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

开局一张图,其它全靠编。

这里可以看到此abcdefg方法总共有四步构成,1:判断参数dynamicScrip是否为空,2使用hijklmn方法处理字符串dynamicScrip(hijklmn方法下面就有,可以使用拿来原则),3.eval 执行处理过的dynamicScrip字符串返回值为code,4.返回code值,到此结束。

我们只需要处理第三步就行了,之所以需要处理是因为我们需要用自己的环境来执行这些js代码,其中有些对象和属性只有浏览器中有,这样的话就只能自己先解析一下判读出执行这个字符串所需要用到的对象。

现在我们自己来一步一步解析,先把经过hijklmn处理后的dynamicScrip给复制出来,并格式化,会得到一段这个代码。

将这段代码粘贴到你所打开的酒店详情页的console中运行,就可以得到最终的code值(如下图)。

不过这样子还不行,还需要继续往下分析。在上图中的代码里的最后一行代码可以解为:

这是最后的js方法(js代码如下):

amafunction();
function amafunction() {try {var aaa = 6823095;var bbb = 129;var ccc = 970;var ddd = 738;var fff = 789;var eee = bbb + ddd;var ggg = 123;if (validatePageData()) {return aaa}if (validateHeightAndWidth()) {return aaa + eee}if (!validateErrorStack()) {return aaa - ccc - fff - ggg} else {return aaa + ddd}} catch(e) {return - 99}
}
function validatePageData() {var temp = document.getElementsByClassName('t24 yahei');if (temp.length == 0) {return true}return false
}
function validateHeightAndWidth() {var heigh = window.outerHeight;var width = window.outerWidt;if (0 == heigh || 0 == width) {return true} else {return false}
}
function validateErrorStack() {var stackDetectionKeys = ["phantomjs", "callFunction", "pyppeteer", "moz"];try {null[0]()} catch(e) {for (var i = 0,len = stackDetectionKeys.length; i < len; i++) {var stackDetectionKeyValue = stackDetectionKeys[i];if (e.stack.indexOf(stackDetectionKeyValue) > -1) {return true}}}return false
}

可以发现其中需要什么 document.getElementsByClassName,window.outerHeight 这种东西,如果不是在浏览器环境下运行就这些东西就需要自己补全,还有这只是其中一种情况,而且更改频率极高,搞得我是筋疲力竭,以经处于半放弃状态。

 

 

最后还是要说一句,爬虫最好还是要写的友好一些,速度能慢则慢,能在晚上爬就绝对不在白天爬,对别人网站影响较大的话,就降低影响。

爬虫之路,且行且珍惜吧。

写于 2019/3/31,一个周末无聊的晚上。

这篇关于爬虫与反爬之艺龙反爬(code值的生成,下,算法篇)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/260339

相关文章

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

MySQL中动态生成SQL语句去掉所有字段的空格的操作方法

《MySQL中动态生成SQL语句去掉所有字段的空格的操作方法》在数据库管理过程中,我们常常会遇到需要对表中字段进行清洗和整理的情况,本文将详细介绍如何在MySQL中动态生成SQL语句来去掉所有字段的空... 目录在mysql中动态生成SQL语句去掉所有字段的空格准备工作原理分析动态生成SQL语句在MySQL

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

Java利用docx4j+Freemarker生成word文档

《Java利用docx4j+Freemarker生成word文档》这篇文章主要为大家详细介绍了Java如何利用docx4j+Freemarker生成word文档,文中的示例代码讲解详细,感兴趣的小伙伴... 目录技术方案maven依赖创建模板文件实现代码技术方案Java 1.8 + docx4j + Fr

Java编译生成多个.class文件的原理和作用

《Java编译生成多个.class文件的原理和作用》作为一名经验丰富的开发者,在Java项目中执行编译后,可能会发现一个.java源文件有时会产生多个.class文件,从技术实现层面详细剖析这一现象... 目录一、内部类机制与.class文件生成成员内部类(常规内部类)局部内部类(方法内部类)匿名内部类二、

使用Jackson进行JSON生成与解析的新手指南

《使用Jackson进行JSON生成与解析的新手指南》这篇文章主要为大家详细介绍了如何使用Jackson进行JSON生成与解析处理,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 核心依赖2. 基础用法2.1 对象转 jsON(序列化)2.2 JSON 转对象(反序列化)3.

java中使用POI生成Excel并导出过程

《java中使用POI生成Excel并导出过程》:本文主要介绍java中使用POI生成Excel并导出过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录需求说明及实现方式需求完成通用代码版本1版本2结果展示type参数为atype参数为b总结注:本文章中代码均为

在java中如何将inputStream对象转换为File对象(不生成本地文件)

《在java中如何将inputStream对象转换为File对象(不生成本地文件)》:本文主要介绍在java中如何将inputStream对象转换为File对象(不生成本地文件),具有很好的参考价... 目录需求说明问题解决总结需求说明在后端中通过POI生成Excel文件流,将输出流(outputStre

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时