正则在小偷程序中的应用(续)

2023-11-21 02:38
文章标签 程序 应用 正则 小偷

本文主要是介绍正则在小偷程序中的应用(续),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

	//获取资源信息$content = file_get_contents("http://list.sososteel.com/qg/list.html?pg=1&h=".time());/*对抓取的信息进行处理。取class为listTable的表信息。[^<>]匹配除<>外的所有字符。*?用的是懒惰限定符,代表重复任意次,但尽量少重复。即匹配最短的以<table开始的,以class="listTable"为结束的字符串。如aabbcc字符串,如果用懒惰限定符匹配的话应该是aab。如果用贪婪匹配的话应该aabb。*/preg_match("/<table [^<>]*? class=\\\"listTable\\\">(.*?)<\/table>/s",$content,$out);/*抓取tbody的内容,重复一次或多次*/preg_match_all("/<tbody>(.+?)<\/tbody>/s",$out[1],$outData);if(empty($outData[1])){return null;}else{$out_arr=array();//循环输出抓取的内容foreach($outData[1] as $i=>$key){//取td的内容preg_match_all("/<td.*?>(.+?)<\/td>/s",$key,$td);if(count($td[1])==7){foreach($td[1] as $j=>$em){//$em = iconv("gb2312","utf-8",$em);switch($j){case 0:continue;break;case 1:continue;break;case 2:preg_match_all("/<a.*?>(.+?)\<\/a>/s",$em,$name);$out_arr[$i]['name']=$name[1][0];preg_match_all("/<span.*?>(.+?)\<\/span>/s",$em,$time);$out_arr[$i]['time']=$time[1][0];preg_match_all("/<div class=\\\"listText\\\">(.+?)<br \/>/s",$em,$other);if(empty($other[1])){$out_arr[$i]['spec']=null;$out_arr[$i]['mater']=null;$out_arr[$i]['factory']=null;}else{$oth=explode("   ",implode('',$other[1]));$out_arr[$i]['spec']=trim($oth[0]);$out_arr[$i]['mater']=trim($oth[1]);$out_arr[$i]['factory']=trim($oth[2]);}$out_arr[$i]['company']=$name[1][1];continue;break;case 3:$out_arr[$i]['city']=trim($em);continue;break;case 4:$out_arr[$i]['price']=trim(strip_tags($em));continue;break;}}} elsecontinue;}}print_r($out_arr);


这篇关于正则在小偷程序中的应用(续)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/399245

相关文章

Django调用外部Python程序的完整项目实战

《Django调用外部Python程序的完整项目实战》Django是一个强大的PythonWeb框架,它的设计理念简洁优雅,:本文主要介绍Django调用外部Python程序的完整项目实战,文中通... 目录一、为什么 Django 需要调用外部 python 程序二、三种常见的调用方式方式 1:直接 im

线程池ThreadPoolExecutor应用过程

《线程池ThreadPoolExecutor应用过程》:本文主要介绍如何使用ThreadPoolExecutor创建线程池,包括其构造方法、常用方法、参数校验以及如何选择合适的拒绝策略,文章还讨论... 目录ThreadPoolExecutor构造说明及常用方法为什么强制要求使用ThreadPoolExec

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

Nginx内置变量应用场景分析

《Nginx内置变量应用场景分析》Nginx内置变量速查表,涵盖请求URI、客户端信息、服务器信息、文件路径、响应与性能等类别,这篇文章给大家介绍Nginx内置变量应用场景分析,感兴趣的朋友跟随小编一... 目录1. Nginx 内置变量速查表2. 核心变量详解与应用场景3. 实际应用举例4. 注意事项Ng

Java中的随机数生成案例从范围字符串到动态区间应用

《Java中的随机数生成案例从范围字符串到动态区间应用》本文介绍了在Java中生成随机数的多种方法,并通过两个案例解析如何根据业务需求生成特定范围的随机数,本文通过两个实际案例详细介绍如何在java中... 目录Java中的随机数生成:从范围字符串到动态区间应用引言目录1. Java中的随机数生成基础基本随

Mysql 驱动程序的程序小结

《Mysql驱动程序的程序小结》MySQL驱动程序是连接应用程序与MySQL数据库的重要组件,根据不同的编程语言和应用场景,MySQL提供了多种驱动程序,下面就来详细的了解一下驱动程序,感兴趣的可以... 目录一、mysql 驱动程序的概念二、常见的 MySQL 驱动程序1. MySQL Connector

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二