正则表达式解析与应用:深度剖析正则表达式的威力

2024-01-05 21:12

本文主要是介绍正则表达式解析与应用:深度剖析正则表达式的威力,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~
🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志
🎐 个人CSND主页——Micro麦可乐的博客
🐥《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程,入门到实战
🌺《RabbitMQ》本专栏主要介绍使用JAVA开发RabbitMQ的系列教程,从基础知识到项目实战
🌸《设计模式》专栏以实际的生活场景为案例进行讲解,让大家对设计模式有一个更清晰的理解
如果文章能够给大家带来一定的帮助!欢迎关注、评论互动~

正则表达式解析与应用:深度剖析正则表达式的威力

  • 概述
  • 正则表达式简介
  • 正则表达式的基本语法
  • 正则表达式的高级语法
  • 实战应用示例
        • 提取图片标签中的链接
        • 匹配IPv4地址
        • 匹配HTML注释
        • 邮箱验证
        • URL提取
        • HTML标签匹配
        • 验证身份证号(15位或18位数字)
        • 验证手机号码
        • 只能输入数字
        • 验证域名
  • 总结

概述

正则表达式是一种强大的文本匹配和处理工具,它在各种编程语言和文本编辑器中广泛应用。本文将深入解析正则表达式的概念、语法、常见用法以及在实际应用中的技巧。

正则表达式简介

正则表达式是一种用于描述字符串模式的表达式。它可以用来匹配、查找、替换文本中的字符串,具有强大而灵活的文本处理能力。正则表达式不仅仅是一种语法,更是一种强大的字符串处理思维方式。

正则表达式的基本语法

字符类

普通字符: 例如,a 匹配字符 a
转义字符: 使用反斜杠\转义特殊字符,如 \.匹配点号 .

元字符

.(点号): 匹配任意字符,除了换行符
^ 匹配字符串的开始
$ 匹配字符串的结束

字符集合

[...] 匹配括号内的任意一个字符
[^...] 匹配除了括号内字符的任意一个字符

量词

* 匹配前一个元素零次或多次
+ 匹配前一个元素一次或多次
? 匹配前一个元素零次或一次
{n} 匹配前一个元素恰好 n 次
{n,} 匹配前一个元素至少 n 次
{n,m} 匹配前一个元素至少 n 次但不超过 m 次

正则表达式的高级语法

转义与原始字符串
在正则表达式中,某些字符有特殊含义,如 .* 等。如果想匹配这些字符本身,需要使用反斜杠进行转义。在某些编程语言中,为了简化正则表达式的书写,还可以使用原始字符串(Raw String)来避免双重转义。例如,在Python中:

# 非原始字符串
pattern = "\\d+"# 原始字符串
pattern_raw = r"\d+"

非捕获分组
有时我们需要使用分组来对正则表达式的一部分进行重复,但又不希望捕获这个分组,可以使用非捕获分组 (?:...)。例如:

(?:https?://)?([^/\s]+)(/[^\s]*)?

上述正则表达式可以匹配 URL,但只捕获了主机名和路径,而不捕获协议部分。

后向引用
后向引用允许在正则表达式中引用先前匹配的子表达式,使用 \1\2等来表示。这在需要匹配对称字符(如括号)或重复出现的模式时非常有用。例如:

(\w)\1

上述正则表达式匹配连续两个相同的字母。

零宽断言
零宽断言是一种先行或后顾条件的匹配,但并不包含在最终的匹配结果中。它包括正向先行断言 (?=...)、负向先行断言 (?!...)、正向后顾断言 (?<=...) 和负向后顾断言 (?<!...)。例如:

(?<=@)\w+

上述正则表达式匹配 @ 后面的字母字符,但不包括 @。

命名分组
为了方便引用,我们可以给分组命名,使用 (?<name>...)(?'name'...)。例如:

(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})

实战应用示例

提取图片标签中的链接
<img[^>]*src=['"]([^'"]+)['"][^>]*>
匹配IPv4地址
\b(?:\d{1,3}\.){3}\d{1,3}\b
匹配HTML注释
<!--.*?-->
邮箱验证
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
URL提取
https?://[^\s]+
HTML标签匹配
<[^>]+>
验证身份证号(15位或18位数字)
^\d{15}|\d{18}$
验证手机号码
^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$ 
只能输入数字
//限制只能输入数字
^[0-9]*$
//整数或者小数
^[0-9]+\.{0,1}[0-9]{0,2}$
验证域名
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.? 

总结

正则表达式作为文本处理的得力助手,在处理字符串时展现出强大的功能。通过深入理解正则表达式的语法和技巧,我们能更加高效地进行文本处理和匹配,为程序开发、数据清理等场景提供强大的支持。希望通过本文的介绍,大家能够更加深入地掌握正则表达式的使用方法,发挥其强大的匹配和处理能力。

这篇关于正则表达式解析与应用:深度剖析正则表达式的威力的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/574178

相关文章

Golang HashMap实现原理解析

《GolangHashMap实现原理解析》HashMap是一种基于哈希表实现的键值对存储结构,它通过哈希函数将键映射到数组的索引位置,支持高效的插入、查找和删除操作,:本文主要介绍GolangH... 目录HashMap是一种基于哈希表实现的键值对存储结构,它通过哈希函数将键映射到数组的索引位置,支持

C语言中位操作的实际应用举例

《C语言中位操作的实际应用举例》:本文主要介绍C语言中位操作的实际应用,总结了位操作的使用场景,并指出了需要注意的问题,如可读性、平台依赖性和溢出风险,文中通过代码介绍的非常详细,需要的朋友可以参... 目录1. 嵌入式系统与硬件寄存器操作2. 网络协议解析3. 图像处理与颜色编码4. 高效处理布尔标志集合

Python正则表达式语法及re模块中的常用函数详解

《Python正则表达式语法及re模块中的常用函数详解》这篇文章主要给大家介绍了关于Python正则表达式语法及re模块中常用函数的相关资料,正则表达式是一种强大的字符串处理工具,可以用于匹配、切分、... 目录概念、作用和步骤语法re模块中的常用函数总结 概念、作用和步骤概念: 本身也是一个字符串,其中

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

Python利用ElementTree实现快速解析XML文件

《Python利用ElementTree实现快速解析XML文件》ElementTree是Python标准库的一部分,而且是Python标准库中用于解析和操作XML数据的模块,下面小编就来和大家详细讲讲... 目录一、XML文件解析到底有多重要二、ElementTree快速入门1. 加载XML的两种方式2.

Java的栈与队列实现代码解析

《Java的栈与队列实现代码解析》栈是常见的线性数据结构,栈的特点是以先进后出的形式,后进先出,先进后出,分为栈底和栈顶,栈应用于内存的分配,表达式求值,存储临时的数据和方法的调用等,本文给大家介绍J... 目录栈的概念(Stack)栈的实现代码队列(Queue)模拟实现队列(双链表实现)循环队列(循环数组

Java中的Lambda表达式及其应用小结

《Java中的Lambda表达式及其应用小结》Java中的Lambda表达式是一项极具创新性的特性,它使得Java代码更加简洁和高效,尤其是在集合操作和并行处理方面,:本文主要介绍Java中的La... 目录前言1. 什么是Lambda表达式?2. Lambda表达式的基本语法例子1:最简单的Lambda表

java解析jwt中的payload的用法

《java解析jwt中的payload的用法》:本文主要介绍java解析jwt中的payload的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java解析jwt中的payload1. 使用 jjwt 库步骤 1:添加依赖步骤 2:解析 JWT2. 使用 N

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

Python结合PyWebView库打造跨平台桌面应用

《Python结合PyWebView库打造跨平台桌面应用》随着Web技术的发展,将HTML/CSS/JavaScript与Python结合构建桌面应用成为可能,本文将系统讲解如何使用PyWebView... 目录一、技术原理与优势分析1.1 架构原理1.2 核心优势二、开发环境搭建2.1 安装依赖2.2 验