PHP通过CURL爬取携程特价机票(国内/国际/单程/往返)

2023-11-06 03:10

本文主要是介绍PHP通过CURL爬取携程特价机票(国内/国际/单程/往返),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

第一步先确认要抓取的地方是否是和我的一样(如果是请继续浏览,如果不是请自便)
在这里插入图片描述
确认过眼神,这就是你想要爬取的网页那就往下浏览把
(1)先获取所有的城市列表。
可以自己整理一份,也可以爬取网络上的城市列表。由于爬取过飞猪的城市列表,所以就没爬取携程的。这里我把爬取飞猪城市列表的代码分享一下。大家可以参考。

//获取飞猪的城市列表$url = "https://webresource.c-ctrip.com/code/cquery/resource/address/flight/fuzzy_start_poi_timezone_gb2312.js??CR_2016_04_26_00_00_00";$ch = curl_init();curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);curl_setopt($ch, CURLOPT_HEADER, false);curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_REFERER, $url);curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);$result = curl_exec($ch);curl_close($ch);$city = array();preg_match_all('/\((.*?)\)/i',$result,$city);$city = $city['1'];$city_1 = array();foreach ($city as $key=>$value) {if (strlen($value) != 3) {unset($city[$key]);}}$citys = array_merge($city,$city_1);$cityName = array();foreach ($citys as $val) {$cityName[$val] = $val;}

获取到的数据如下
在这里插入图片描述
(2)确认是否获取到了城市列表。获取到了就开始爬取。
我爬取的是 单程/往返 出发地 到 全世界的数据 代码如下

foreach ($cityName as $value) {$city = $value;$url = 'https://flights.ctrip.com/fuzzy/search';$da = '{"inputDepartureCity":"$city","inputDepartureCityName":"null","travelType":"ONEWAY","departStringDate":"任何时间","departDateRanges":[],"maxDays":-1,"minDays":-1,"inputArrivalCities":{"themes":[],"cities":[],"areas":[]},"inputArrivalCitiesMap":{"themes":[],"cities":[],"areas":[],"filter":{}},"isSearchPage":true,"sortingType":"PRICE_ASC","isIncludedTax":true,"city_offset":480}';$da = str_replace('$city', $city, $da);$ch= curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);//设置请求头信息 这里是json数据curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json;charset=utf-8'));curl_setopt($ch, CURLOPT_ENCODING, 'gzip,deflate');curl_setopt($ch, CURLOPT_POST, 1);if($da) {$da = is_array($da) ? json_encode($da) : $da;curl_setopt($ch, CURLOPT_POSTFIELDS, $da);}curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);curl_exec($ch);$str = curl_exec($ch);curl_close($ch);
//            print_r($str);die;}

这里便获取到了数据,数据如下
在这里插入图片描述
上面是获取的单程,国内和国际的所有机票信息。想获取往返的只需要将下图的这里改为"ROUNDTRIP"
在这里插入图片描述
第二步将获取的数据进行处理
当然我这里肯定有一份处理好的源码。但是代码过长不方便分享。
友情提示(如何获取携程数据的源码以经分享。如何处理这便靠自己。)
在提示一条(数据里面有国际/国内/包含税费/不包含税费所以处理的时候请认真对照网页上的数据找出规律)
在这里插入图片描述

这篇关于PHP通过CURL爬取携程特价机票(国内/国际/单程/往返)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/354137

相关文章

PHP原理之内存管理中难懂的几个点

PHP的内存管理, 分为俩大部分, 第一部分是PHP自身的内存管理, 这部分主要的内容就是引用计数, 写时复制, 等等面向应用的层面的管理. 而第二部分就是今天我要介绍的, zend_alloc中描写的关于PHP自身的内存管理, 包括它是如何管理可用内存, 如何分配内存等. 另外, 为什么要写这个呢, 因为之前并没有任何资料来介绍PHP内存管理中使用的策略, 数据结构, 或者算法. 而在我们

php中json_decode()和json_encode()

1.json_decode() json_decode (PHP 5 >= 5.2.0, PECL json >= 1.2.0) json_decode — 对 JSON 格式的字符串进行编码 说明 mixed json_decode ( string $json [, bool $assoc ] ) 接受一个 JSON 格式的字符串并且把它转换为 PHP 变量 参数 json

如何将文件夹里的PHP代码放到一个文件里

find ./dir -name "*.php" -exec 'cat' {} \; > dir.out

PHP抓取网站图片脚本

方法一: <?phpheader("Content-type:image/jpeg"); class download_image{function read_url($str) { $file=fopen($str,"r");$result = ''; while(!feof($file)) { $result.=fgets($file,9999); } fclose($file); re

PHP防止SQL注入详解及防范

SQL 注入是PHP应用中最常见的漏洞之一。事实上令人惊奇的是,开发者要同时犯两个错误才会引发一个SQL注入漏洞。 一个是没有对输入的数据进行过滤(过滤输入),还有一个是没有对发送到数据库的数据进行转义(转义输出)。这两个重要的步骤缺一不可,需要同时加以特别关注以减少程序错误。 对于攻击者来说,进行SQL注入攻击需要思考和试验,对数据库方案进行有根有据的推理非常有必要(当然假设攻击者看不到你的

PHP防止SQL注入的方法(2)

如果用户输入的是直接插入到一个SQL语句中的查询,应用程序会很容易受到SQL注入,例如下面的例子: $unsafe_variable = $_POST['user_input'];mysql_query("INSERT INTO table (column) VALUES ('" . $unsafe_variable . "')"); 这是因为用户可以输入类似VALUE”); DROP TA

PHP防止SQL注入的方法(1)

(1)mysql_real_escape_string – 转义 SQL 语句中使用的字符串中的特殊字符,并考虑到连接的当前字符集 使用方法如下: $sql = "select count(*) as ctr from users where username ='".mysql_real_escape_string($username)."' and password='". mysql_r

Linux系统安装php开发环境

Linux系统centos6.5 PHP5.6 MySQL5.6 Nginx1.7 yum安装依赖库 yum install -y make cmake gcc gcc-c++ autoconf automake libpng-devel libjpeg-devel zlib libxml2-devel ncurses-devel bison \libtool-ltdl-devel li

PHP字符串全排列

方法一: $str = 'abc';$a =str_split($str);perm($a, 0, count($a)-1);function perm(&$ar, $k, $m) {if($k == $m){ echo join('',$ar), PHP_EOL;}else {for($i=$k; $i<=$m; $i++) {swap($ar[$k], $ar[$i]);perm($ar

PHP实现二叉树遍历(非递归方式,栈模拟实现)

二叉树定义是这样的:一棵非空的二叉树由根结点及左、右子树这三个基本部分组成,根据节点的访问位置不同有三种遍历方式: ① NLR:前序遍历(PreorderTraversal亦称(先序遍历)) ——访问结点的操作发生在遍历其左右子树之前。 ② LNR:中序遍历(InorderTraversal) ——访问结点的操作发生在遍历其左右子树之中(间)。 ③ LRN:后序遍历(PostorderT