正则表达式解析与应用:深度剖析正则表达式的威力

2024-01-05 21:12

本文主要是介绍正则表达式解析与应用:深度剖析正则表达式的威力,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~
🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志
🎐 个人CSND主页——Micro麦可乐的博客
🐥《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程,入门到实战
🌺《RabbitMQ》本专栏主要介绍使用JAVA开发RabbitMQ的系列教程,从基础知识到项目实战
🌸《设计模式》专栏以实际的生活场景为案例进行讲解,让大家对设计模式有一个更清晰的理解
如果文章能够给大家带来一定的帮助!欢迎关注、评论互动~

正则表达式解析与应用:深度剖析正则表达式的威力

  • 概述
  • 正则表达式简介
  • 正则表达式的基本语法
  • 正则表达式的高级语法
  • 实战应用示例
        • 提取图片标签中的链接
        • 匹配IPv4地址
        • 匹配HTML注释
        • 邮箱验证
        • URL提取
        • HTML标签匹配
        • 验证身份证号(15位或18位数字)
        • 验证手机号码
        • 只能输入数字
        • 验证域名
  • 总结

概述

正则表达式是一种强大的文本匹配和处理工具,它在各种编程语言和文本编辑器中广泛应用。本文将深入解析正则表达式的概念、语法、常见用法以及在实际应用中的技巧。

正则表达式简介

正则表达式是一种用于描述字符串模式的表达式。它可以用来匹配、查找、替换文本中的字符串,具有强大而灵活的文本处理能力。正则表达式不仅仅是一种语法,更是一种强大的字符串处理思维方式。

正则表达式的基本语法

字符类

普通字符: 例如,a 匹配字符 a
转义字符: 使用反斜杠\转义特殊字符,如 \.匹配点号 .

元字符

.(点号): 匹配任意字符,除了换行符
^ 匹配字符串的开始
$ 匹配字符串的结束

字符集合

[...] 匹配括号内的任意一个字符
[^...] 匹配除了括号内字符的任意一个字符

量词

* 匹配前一个元素零次或多次
+ 匹配前一个元素一次或多次
? 匹配前一个元素零次或一次
{n} 匹配前一个元素恰好 n 次
{n,} 匹配前一个元素至少 n 次
{n,m} 匹配前一个元素至少 n 次但不超过 m 次

正则表达式的高级语法

转义与原始字符串
在正则表达式中,某些字符有特殊含义,如 .* 等。如果想匹配这些字符本身,需要使用反斜杠进行转义。在某些编程语言中,为了简化正则表达式的书写,还可以使用原始字符串(Raw String)来避免双重转义。例如,在Python中:

# 非原始字符串
pattern = "\\d+"# 原始字符串
pattern_raw = r"\d+"

非捕获分组
有时我们需要使用分组来对正则表达式的一部分进行重复,但又不希望捕获这个分组,可以使用非捕获分组 (?:...)。例如:

(?:https?://)?([^/\s]+)(/[^\s]*)?

上述正则表达式可以匹配 URL,但只捕获了主机名和路径,而不捕获协议部分。

后向引用
后向引用允许在正则表达式中引用先前匹配的子表达式,使用 \1\2等来表示。这在需要匹配对称字符(如括号)或重复出现的模式时非常有用。例如:

(\w)\1

上述正则表达式匹配连续两个相同的字母。

零宽断言
零宽断言是一种先行或后顾条件的匹配,但并不包含在最终的匹配结果中。它包括正向先行断言 (?=...)、负向先行断言 (?!...)、正向后顾断言 (?<=...) 和负向后顾断言 (?<!...)。例如:

(?<=@)\w+

上述正则表达式匹配 @ 后面的字母字符,但不包括 @。

命名分组
为了方便引用,我们可以给分组命名,使用 (?<name>...)(?'name'...)。例如:

(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})

实战应用示例

提取图片标签中的链接
<img[^>]*src=['"]([^'"]+)['"][^>]*>
匹配IPv4地址
\b(?:\d{1,3}\.){3}\d{1,3}\b
匹配HTML注释
<!--.*?-->
邮箱验证
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
URL提取
https?://[^\s]+
HTML标签匹配
<[^>]+>
验证身份证号(15位或18位数字)
^\d{15}|\d{18}$
验证手机号码
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 
只能输入数字
//限制只能输入数字
^[0-9]*$
//整数或者小数
^[0-9]+\.{0,1}[0-9]{0,2}$
验证域名
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? 

总结

正则表达式作为文本处理的得力助手,在处理字符串时展现出强大的功能。通过深入理解正则表达式的语法和技巧,我们能更加高效地进行文本处理和匹配,为程序开发、数据清理等场景提供强大的支持。希望通过本文的介绍,大家能够更加深入地掌握正则表达式的使用方法,发挥其强大的匹配和处理能力。

这篇关于正则表达式解析与应用:深度剖析正则表达式的威力的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/574178

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。