php关于正则表达式贪婪模式与非贪婪

2024-06-21 11:08

本文主要是介绍php关于正则表达式贪婪模式与非贪婪,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    工作中,我们经常要用到正则表达式去匹配到我们想要的数据,甚至还会把匹配到的数据替换成我们需要的数据。这一切,似乎很难做到,但是如果你会熟练使用正则表达式,这些,就不是个菜了。

一、贪婪与非贪婪

贪婪模式:可以这样认为,就是在整个表达式匹配成功的前提下,尽可能多的匹配,也就是所谓的“贪婪”,通俗点讲,就是看到想要的,有多少就捡多少,除非再也没有想要的了。

非贪婪模式:可以这样认为,就是在整个表达式匹配成功的前提下,尽可能少的匹配,也就是所谓的“非贪婪”,通俗点讲,就是找到一个想要的捡起来就行了,至于还有没有没捡的就不管了。

什么叫贪婪,比如说要从字符串中<td>香肠</td><td>月饼</td>吃东西,本来 你只可以吃香肠,可是你贪心,于是就把第一个<td>到最后一个</td>里面的两个吃的取出来了,你想多吃点,非贪婪也就是 你不贪吃了,就只吃香肠。

我们来看看正则里面是怎么贪婪的:

<?php
$str = '<td>香肠</td><td>月饼</td>';
preg_match('/<td>(.*)<\/td>/',$str,$rs);
print_r($rs);
?>

这样输出的结果是:

Array ( [0] => 香肠月饼 [1] => 香肠月饼 ) 

怎么来限制贪婪?

在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配。

<?php
$str = '<td>香肠</td><td>月饼</td>';
preg_match('/<td>(.*?)<\/td>/',$str,$rs);
print_r($rs);
?>
这样输出的结果是:

Array ( [0] => 香肠 [1] => 香肠 ) 

在PHP中还可以通过模式修饰符来实现,大写"U":

<?php
$str = '<td>香肠</td><td>月饼</td>';
preg_match('/<td>(.*)<\/td>/U',$str,$rs);
print_r($rs);
?>

这样输出的结果是与上面一样的!

二、预搜索

预搜索是一个非获取匹配,不进行存储供以后使用。

1、正向预搜索  "(?=xxxxx)","(?!xxxxx)"

"(?=xxxxx)”:所在缝隙的右侧,必须能够匹配上 xxxxx 这部分的表达式,

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match('/windows (?=xp)/',$str,$res);
print_r($res);
?>

结果:

Array 
( [0] => windows 
)

这个是xp前面的windows,不会取NT和2003前面的。

格式:"(?!xxxxx)",所在缝隙的右侧,必须不能匹配 xxxxx 这部分表达式

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match_all('/windows (?!xp)/',$str,$res);
print_r($res);
?>

结果:

Array 
( [0] => Array ( [0] => windows    这个是nt前面的 [1] => windows    这个是2003前面的 )
)

从这里可以看出,预搜索不进行存储供以后使用。与会存储的对比下。

<?php
$str = 'windows NT windows 2003 windows xp';
preg_match_all('/windows ([^xp])/',$str,$res);
print_r($res);
?>

结果:

Array 
( [0] => Array    全部模式匹配的数组    ( [0] => windows N   [1] => windows 2 )[1] => Array   子模式所匹配的字符串组成的数组,通过存储取得。 ( [0] => N [1] => 2 )
)

2、反向预搜索   "(?<=xxxxx)","(?<!xxxxx)"

"(?<=xxxxx)" :所在缝隙的 "左侧”能够匹配xxxxx部分。 

<?php
$str = '1234567890123456';
preg_match('/(?<=\d{4})\d+(?=\d{4})/',$str,$res);
print_r($res);
?>
结果:

Array 
( [0] => 56789012 
)

匹配除了前4个数字和后4个数字之外的中间8个数字 
"(?<!xxxxx)":所在缝隙的“左侧”不能匹配xxxx部分。

<?php
$str = '我1234567890123456';
preg_match('/(?<!我)\d+/',$str,$res);
print_r($res);
?>

结果:

Array 
( [0] => 234567890123456 
)

@下面的例子其实主要讲了三个函数 preg_replace(); preg_match_all();preg_match()的基本用法。有兴趣的就看下吧!

例1

我们把需要替换的放在parrerns数组里面,把换成后的数据放在replacement数组里面:

$string为一个字符串,定义$patterns为一个基于索引的数组:

函数讲解:preg_replace();mixedpreg_replace ( mixed$pattern ,mixed$replacement ,mixed$subject [,int$limit = -1 [,int&$count ]] )

搜索subject中匹配pattern的部分, 以replacement进行替换。

<?php
date_default_timezone_set("Asia/Shanghai");
$string = 'kemo|addidas|就是这样的|haha|2013-12-13 09:00:09|weobo|lail';
$patterns = array();
$patterns[0] = '/2013-12-13 09:00:09/';
$patterns[1] = '/weobo/';
$patterns[2] = '/lail/';
$replacements = array();
$replacements[2] = date('Y-m-d H:i:s',time());
$replacements[1] = 'tengx';
$replacements[0] = 'buyao';
echo preg_replace($patterns, $replacements, $string);
?>


以上的例子会输出:

kemo|addidas|就是这样的|haha|2013-12-14 11:40:43|tengx|buyao 

以上例子我们可以把我们需要替换的值用索引数组的形式表达出来,然后一个一个的去替换,是不是很方便呢?


例2:

下面么再来看一个,我们需要把字符串里面的日期转当前的日期或者为我们需要的东西

<?php
date_default_timezone_set("Asia/Shanghai");
$string = 'kemo|addidas|就是这样的|haha|2013-12-13 09:00:09|weobo|lail'; 
$pattern = '/\d{4}-\d{2}-\d{2}\s+\d{2}:\d{2}:\d{2}/';
$replacement = date('Y-m-d H:i:s',time());
echo preg_replace($pattern, $replacement, $string);
?>

以上的例子会输出:

kemo|addidas|就是这样的|haha|2013-12-14 12:07:55|weobo|lail
字符串里面的日期被换成今天的日期了。

例3:

正则表达式如何匹配出现第一次出现下划线以前的内容

函数讲解:preg_match_all();intpreg_match_all (string $pattern ,string$subject [,array&$matches [,int$flags =PREG_PATTERN_ORDER [,int$offset = 0 ]]] )

搜索subject中所有匹配pattern给定正则表达式 的匹配结果并且将它们以flag指定顺序输出到matches中.

在第一个匹配找到后, 子序列继续从最后一次匹配位置搜索.

<?php
date_default_timezone_set("Asia/Shanghai");
$content="正则表达式如何匹配第一次出现下划线以前的内容_第二次_第三次_";
preg_match_all('/([^_]*?)_/i',$content, $matches);
if(count($matches[1])>0)
{ echo $matches[1][0];
}
var_dump($matches);
?>


以上的例子会输出:

正则表达式如何匹配第一次出现下划线以前的内容

上面的数组打印出来的结果为:

array(2) { [0]=> array(3) { [0]=> string(45) "正则表达式如何匹配第一次出现下划线以前的内容_" [1]=> string(7) "第二次_" [2]=> string(7) "第三次_" } [1]=> array(3) { [0]=> string(44) "正则表达式如何匹配第一次出现下划线以前的内容" [1]=> string(6) "第二次" [2]=> string(6) "第三次" } } 

例4:

函数讲解:preg_match()搜索subjectpattern给定的正则表达式的一个匹配.

preg_match()返回 pattern 的匹配次数。 它的值将是0次(不匹配)或1次,因为 preg_match()在第一次匹配后 将会停止搜索。 preg_match_all()不同于此,它会一直搜索subject 直到到达结尾。 如果发生错误 preg_match()返回 FALSE

<?php  
date_default_timezone_set("Asia/Shanghai");  
$pattern="/\d{4}(\W)\d{2}\\1\d{2}\s+\d{2}(\W)\d{2}\\2\d{2}\s+(?:am|pm)/";   //正则表达式模式
$string="today is 2013/12/14 10:35:28 am...";      //需要和上面模式字符串进行匹配的变量字符串if(preg_match($pattern, $string, $arr)){echo "正则表达式 <b>{$pattern} </b>和字符串 <b>{$string}</b> 匹配成功<br>";echo '<pre>';print_r($arr);echo '</pre>';}else{echo "<font color='red'>正则表达式{$pattern} 和字符串 {$string} 匹配失败</font>";}
?>


以上的例子会输出:

正则表达式 /\d{4}(\W)\d{2}\1\d{2}\s+\d{2}(\W)\d{2}\2\d{2}\s+(?:am|pm)/ 和字符串 today is 2013/12/14 10:35:28 am... 匹配成功Array
([0] => 2013/12/14 10:35:28 am[1] => /[2] => :
)

匹配字符串里面的时间匹配成功。


例5:

匹配字符串中的url

<?php  
date_default_timezone_set("Asia/Shanghai");  
$str="这是一个正则表https://www.sina.com达式的匹配函数";
$url="/(https?|ftps?):\/\/((www|mail|news)\.([^\.\/]+)\.(com|org|net|cn))/i";
if(preg_match($url, $str, $arr)){echo "字符串中有正确的URL信息<br>";echo '<pre>';print_r($arr);echo '</pre>';
}else{
echo "字符串中不包括URL";
}
?>

以上的例子会输出:

字符串中有正确的URL信息Array
([0] => https://www.sina.com[1] => https[2] => www.sina.com[3] => www[4] => sina[5] => com
)

@其实我们也可以封装一个函数去完成匹配URL的功能:


<?php  
date_default_timezone_set("Asia/Shanghai");  
$str="这是一个正则表https://www.baidu.com达式的匹配函数
这是一个正则表http://www.baidu1.com达式的匹配函数
这是一个正则表https://mail.baidu2.com达式的匹配函数
这是一个正则表https://news.baidu3.com达式的匹配函数
这是一个正则表https://www.baidu4.org达式的匹配函数
这是一个正则表https://www.baidu5.net达式的匹配函数
这是一个正则表ftps://www.baidu6.com达式的匹配函数
这是一个正则表ftp://www.google7.com达式的匹配函数
这是一个正则表https://www.baidu7.net达式的匹配函数";
function setUrl($str) {$url="/(https?|ftps?):\/\/((www|mail|news)\.([^\.\/]+)\.(com|org|net|cn))/i";preg_match_all($url, $str, $arr,PREG_PATTERN_ORDER );foreach($arr[0] as $url){$str=str_replace($url, '<a href="'.$url.'">'.$url.'</a>', $str);}return  $str;
}
echo setUrl($str);
?>

以上的例子会输出:

这是一个正则表https://www.baidu.com达式的匹配函数 这是一个正则表http://www.baidu1.com达式的匹配函数 这是一个正则表https://mail.baidu2.com达式的匹配函数 这是一个正则表https://news.baidu3.com达式的匹配函数 这是一个正则表https://www.baidu4.org达式的匹配函数 这是一个正则表https://www.baidu5.net达式的匹配函数 这是一个正则表ftps://www.baidu6.com达式的匹配函数 这是一个正则表ftp://www.google7.com达式的匹配函数 这是一个正则表https://www.baidu7.net达式的匹配函数



这篇关于php关于正则表达式贪婪模式与非贪婪的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1081053

相关文章

在JS中的设计模式的单例模式、策略模式、代理模式、原型模式浅讲

1. 单例模式(Singleton Pattern) 确保一个类只有一个实例,并提供一个全局访问点。 示例代码: class Singleton {constructor() {if (Singleton.instance) {return Singleton.instance;}Singleton.instance = this;this.data = [];}addData(value)

模版方法模式template method

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/template-method 超类中定义了一个算法的框架, 允许子类在不修改结构的情况下重写算法的特定步骤。 上层接口有默认实现的方法和子类需要自己实现的方法

【iOS】MVC模式

MVC模式 MVC模式MVC模式demo MVC模式 MVC模式全称为model(模型)view(视图)controller(控制器),他分为三个不同的层分别负责不同的职责。 View:该层用于存放视图,该层中我们可以对页面及控件进行布局。Model:模型一般都拥有很好的可复用性,在该层中,我们可以统一管理一些数据。Controlller:该层充当一个CPU的功能,即该应用程序

迭代器模式iterator

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/iterator 不暴露集合底层表现形式 (列表、 栈和树等) 的情况下遍历集合中所有的元素

《x86汇编语言:从实模式到保护模式》视频来了

《x86汇编语言:从实模式到保护模式》视频来了 很多朋友留言,说我的专栏《x86汇编语言:从实模式到保护模式》写得很详细,还有的朋友希望我能写得更细,最好是覆盖全书的所有章节。 毕竟我不是作者,只有作者的解读才是最权威的。 当初我学习这本书的时候,只能靠自己摸索,网上搜不到什么好资源。 如果你正在学这本书或者汇编语言,那你有福气了。 本书作者李忠老师,以此书为蓝本,录制了全套视频。 试

利用命令模式构建高效的手游后端架构

在现代手游开发中,后端架构的设计对于支持高并发、快速迭代和复杂游戏逻辑至关重要。命令模式作为一种行为设计模式,可以有效地解耦请求的发起者与接收者,提升系统的可维护性和扩展性。本文将深入探讨如何利用命令模式构建一个强大且灵活的手游后端架构。 1. 命令模式的概念与优势 命令模式通过将请求封装为对象,使得请求的发起者和接收者之间的耦合度降低。这种模式的主要优势包括: 解耦请求发起者与处理者

springboot实战学习(1)(开发模式与环境)

目录 一、实战学习的引言 (1)前后端的大致学习模块 (2)后端 (3)前端 二、开发模式 一、实战学习的引言 (1)前后端的大致学习模块 (2)后端 Validation:做参数校验Mybatis:做数据库的操作Redis:做缓存Junit:单元测试项目部署:springboot项目部署相关的知识 (3)前端 Vite:Vue项目的脚手架Router:路由Pina:状态管理Eleme

状态模式state

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/state 在一个对象的内部状态变化时改变其行为, 使其看上去就像改变了自身所属的类一样。 在状态模式中,player.getState()获取的是player的当前状态,通常是一个实现了状态接口的对象。 onPlay()是状态模式中定义的一个方法,不同状态下(例如“正在播放”、“暂停

软件架构模式:5 分钟阅读

原文: https://orkhanscience.medium.com/software-architecture-patterns-5-mins-read-e9e3c8eb47d2 软件架构模式:5 分钟阅读 当有人潜入软件工程世界时,有一天他需要学习软件架构模式的基础知识。当我刚接触编码时,我不知道从哪里获得简要介绍现有架构模式的资源,这样它就不会太详细和混乱,而是非常抽象和易

PHP原理之内存管理中难懂的几个点

PHP的内存管理, 分为俩大部分, 第一部分是PHP自身的内存管理, 这部分主要的内容就是引用计数, 写时复制, 等等面向应用的层面的管理. 而第二部分就是今天我要介绍的, zend_alloc中描写的关于PHP自身的内存管理, 包括它是如何管理可用内存, 如何分配内存等. 另外, 为什么要写这个呢, 因为之前并没有任何资料来介绍PHP内存管理中使用的策略, 数据结构, 或者算法. 而在我们