正则表达式零宽断言

2023-12-19 07:36

本文主要是介绍正则表达式零宽断言,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

正则表达式零宽断言

  • 工具类,正则表达式匹配文本内容
  • 正则表达式语法
  • 例子
    • 例子01
    • 零宽断言
      • ?<= 不包含左边值
      • ?= 不包含右边值
      • 例子
  • 常用正则表达式
    • 校验数字的表达式
    • 校验字符的表达式

工具类,正则表达式匹配文本内容

/*** 	正则表达式工具类*/
public class RegexUtil {/*** 	正则表达式匹配文本内容* @param text	需要查找的内容* @param regex	配置正则表达式* @return	匹配到的内容列表*/public static List<String> getList(String text, String regex) {Pattern pattern = Pattern.compile(regex);Matcher matcher = pattern.matcher(text);List<String> list = new ArrayList<>();while (matcher.find()) {String group = matcher.group();list.add(group);}System.err.println(String.format("group=%s", list));return list;}/*** 从文本中匹配正则表达式,匹配到的文本列表和目标列表进行对比* @param text	需要查找的文本* @param regex	正则表达式* @param targetArr	目标列表*/public static void findAndCompare(String text, String regex, String[] targetArr) {List<String> list = RegexUtil.getList(text, regex);Assert.isTrue(list.equals(Arrays.asList(targetArr)), "两个List应该相等");}
}

正则表达式语法

字符说明例子
\将下一字符标记为特殊字符\n 匹配 换行符\\ 匹配 \\\( 匹配 (
^匹配输入字符串开始的位置
$匹配输入字符串结尾的位置
x|y匹配 x 或 y。"z|food" 匹配 z或者food"(z|f)ood" 匹配 zood 或者 food
[xyz]字符集。匹配包含的任一字符。"[abc]"匹配"plain"中的"a"
[^xyz]反向字符集。匹配未包含的任何字符。"[^pla]"匹配"plain"中的 i和n
[a-z]字符范围。匹配指定范围内的任何字符。
[^a-z]反向范围字符。匹配不在指定的范围内的任何字符。
{n}n 是非负整数。正好匹配 n 次。"zo{2}" 匹配 zoo `
{n,}n 是非负整数。至少匹配 n 次。"zo{2,}" 匹配 zoo 、zooo、 zoooo 等 `
{n,m}m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。"zo{2,3}" 匹配 zoo 、zooo `
*零次或多次匹配前面的字符或子表达式"zo*" 匹配 z、zo、zoo 等效于 zo{0,}
+一次或多次匹配前面的字符或子表达式"zo+" 匹配 zo、zoo 等效于 zo{1,}
?零次或一次匹配前面的字符或子表达式"do(es)?" 匹配 do、does 等效于 do(es){0,1}
.匹配除"\r\n"之外的任何单个字符。若要匹配包括"\r\n"在内的任意字符,请使用诸如"[\s\S]"之类的模式。
\b匹配一个字边界,即字与空格间的位置。
\B非字边界匹配。
\d数字字符匹配等效于 [0-9]
\D非数字字符匹配等效于 [^0-9]
\cx匹配 x 指示的控制字符。x 的值必须在 A-Z 或 a-z 之间。\cM 匹配 Control-M 或回车符
\xn匹配 n,此处的 n 是一个十六进制转义码。十六进制转义码必须正好是两位数长。"\x41"匹配"A""\x041""\x04"&"1"等效
\f换页符匹配。等效于 \x0c 和 \cL
\n换行符匹配。等效于 \x0a 和 \cJ
\r回车符匹配。等效于 \x0d 和 \cM
\t制表符匹配。等效于 \x09 和 \cI
\v垂直制表符匹配。等效于 \x0b 和 \cK
\s任何空白字符匹配。等效于 [ \f\n\r\t\v]
\S任何非空白字符匹配。等效于 [^\f\n\r\t\v]
\w任何字类字符匹配。等效于 [A-Za-z0-9_]
\W任何非单词字符匹配。等效于 [^A-Za-z0-9_]
(pattern)匹配 pattern 并捕获该匹配的子表达式。
(?:pattern)匹配 pattern 但不捕获该匹配的子表达式,即它是一个非捕获匹配,不存储供以后使用的匹配。industr(?:y|ies) 匹配 industry 和 industries
(?=pattern)执行正向预测先行搜索的子表达式,该表达式匹配处于匹配 pattern 的字符串的起始点的字符串。它是一个非捕获匹配,即不能捕获供以后使用的匹配。Windows (?=95|98|NT|2000) 匹配 “Windows 2000” 中的 Windows ; 不匹配 "Windows 3.1"中的 Windows

例子

例子01

public class RegexDemo01 {@Testpublic void test01() {// \ 将下一字符标记为特殊字符RegexUtil.findAndCompare("北京市(海定区)", "\\(", new String[] {"("});// ^ 匹配输入字符串开始的位置RegexUtil.findAndCompare("abc, add, add", "^a\\w+", new String[] {"abc"});// $ 匹配输入字符串结尾的位置RegexUtil.findAndCompare("abd, ddd, abd", "\\w+d$", new String[] {"abd"});}@Testpublic void test02() {// 匹配或者关系RegexUtil.findAndCompare("hello, z and food", "z|food", new String[] {"z", "food"});RegexUtil.findAndCompare("zood, z and food", "(z|f)ood", new String[] {"zood", "food"});// 字符集。匹配包含的任一字符。RegexUtil.findAndCompare("plain", "[abc]", new String[] {"a"});// (在[]中被当成普通字符RegexUtil.findAndCompare("plain (xzy)", "[ab(z)c]", new String[] {"a", "(", "z", ")"});// 字符集。匹配包含的任一字符。RegexUtil.findAndCompare("plain", "[^pla]", new String[] {"i", "n"});}@Testpublic void test03() {String text = "abc, zoooG, zoo, zoom!, bzoo!";// {n}	n 是非负整数。正好匹配 n 次RegexUtil.findAndCompare(text, "zo{3}", new String[] {"zooo"});// {n,}	n 是非负整数。至少匹配 n 次。RegexUtil.findAndCompare(text, "zo{2,}", new String[] {"zooo", "zoo", "zoo", "zoo"});// {n,m}	m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。RegexUtil.findAndCompare(text, "zo{3,4}", new String[] {"zooo"});}@Testpublic void test04() {String text = "abcz, zoy, zoooG, zoo, zoom!, bzoo!";// *	零次或多次匹配前面的字符或子表达式RegexUtil.findAndCompare(text, "zo*", new String[] {"z", "zo", "zooo", "zoo", "zoo", "zoo"});// +	一次或多次匹配前面的字符或子表达式RegexUtil.findAndCompare(text, "zo+", new String[] {"zo", "zooo", "zoo", "zoo", "zoo"});// ?	一次或多次匹配前面的字符或子表达式RegexUtil.findAndCompare(text, "zo(oo)?", new String[] {"zo", "zooo", "zo", "zo", "zo"});}
}

零宽断言

?<= 不包含左边值

(?<=exp) 也叫零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式exp
例如:(?<=\bdanc)\w+\b 查找 I’m dancing,它会匹配 ing

?= 不包含右边值

(?=exp) 也叫零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp
例如:“\b\w+(?=ing\b)” 查找 I’m dancing,它会匹配 danc

例子

public class RegexDemo09 {@Test// 匹配 一个ing结尾的单词public void test01() {String text  = "Pingpong, I'm singing while you're dancing.";String regex  = "\\b\\w+(?=ing\\b)ing";RegexUtil.findAndCompare(text, regex, new String[] {"singing", "dancing"});}@Test// 匹配 一个sing开头的单词public void test02() {String text  = "Pingpong, I'm singing while you're dancing.";String regex  = "sing(?<=\\bsing)\\w+\\b";RegexUtil.findAndCompare(text, regex, new String[] {"singing"});}@Test// 匹配 ()里面的内容public void test03() {String text  = "北京市(海定区)(朝阳区)(西城区)";String regex  = "(?<=\\().*?(?=\\))";RegexUtil.findAndCompare(text, regex, new String[] {"海定区", "朝阳区", "西城区"});}@Test// 匹配 <string></string>里面的内容public void test04() {String text  = "<string>小帅</string>";String regex  = "(?<=\\<string\\>).*?(?=\\</string\\>)";RegexUtil.findAndCompare(text, regex, new String[] {"小帅"});}// @Test// 匹配 <string meta='xx'></string>里面的内容,string里面可以有不确定属性public void test05() {String text  = "<string>小帅</string> <>飞机<> <string meta='utf-8'>小妞</string>";String regex  = "(?<=\\<string\\b(\\w)\\b\\>).*?(?=\\</string\\>)";RegexUtil.findAndCompare(text, regex, new String[] {"小帅"});}
}

常用正则表达式

校验数字的表达式

描述表达式
n位的数字^\d{n}$
至少n位的数字^\d{n,}$
m-n位的数字^\d{m,n}$
零和非零开头的数字^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数^(-)?\d+(.\d{1,2})$
正数、负数、和小数^(-|+)?\d+(.\d+)?$
有两位小数的正实数2+(.[0-9]{2})?$
有1~3位小数的正实数3+(.[0-9]{1,3})?$
非零的正整数4\d*$ 或 ^([1-9][0-9]){1,3}$ 或 ^+?[1-9][0-9]$
非零的负整数^-[1-9][]0-9"$ 或 ^-[1-9]\d$
非负整数^\d+$ 或 5\d*|0$
非正整数^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
非负浮点数^\d+(.\d+)?$ 或 6\d*.\d*|0.\d*[1-9]\d*|0?.0+|0$
非正浮点数^((-\d+(.\d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]\d*.\d*|0.\d*[1-9]\d*))|0?.0+|0$
正浮点数7\d*.\d*|0.\d*[1-9]\d*$ 或 ^(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9]))$
负浮点数^-([1-9]\d*.\d*|0.\d*[1-9]\d*)$ 或 ^(-(([0-9]+.[0-9][1-9][0-9])|([0-9][1-9][0-9].[0-9]+)|([0-9][1-9][0-9])))$
浮点数^(-?\d+)(.\d+)?$ 或 ^-?([1-9]\d*.\d*|0.\d*[1-9]\d*|0?.0+|0)$

校验字符的表达式

这篇关于正则表达式零宽断言的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/511384

相关文章

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

JavaScript正则表达式六大利器:`test`、`exec`、`match`、`matchAll`、`search`与`replace`详解及对比

在JavaScript中,正则表达式(Regular Expression)是一种用于文本搜索、替换、匹配和验证的强大工具。本文将深入解析与正则表达式相关的几个主要执行方法:test、exec、match、matchAll、search和replace,并对它们进行对比,帮助开发者更好地理解这些方法的使用场景和差异。 正则表达式基础 在深入解析方法之前,先简要回顾一下正则表达式的基础知识。正则

关于断言的部分用法

1、带变量的断言  systemVerilog assertion 中variable delay的使用,##[variable],带变量的延时(可变延时)_assertion中的延时-CSDN博客 2、until 的使用 systemVerilog assertion 中until的使用_verilog until-CSDN博客 3、throughout的使用   常用于断言和假设中的

匹配电子邮件地址的正则表达式

这个正则表达式 QRegularExpression regex(R"((\w+)(\.|_)?(\w+)@(\w+)(\.(\w+))+))"); 用于匹配电子邮件地址的格式。下面是对这个正则表达式的逐步解析和解释: 1. QRegularExpression 构造函数 QRegularExpression regex(R"((\w+)(\.|_)?(\w*)@(\w+)(\.(\w+))+

C/C++ 中的assert()宏 断言机制

ASSERT()是一个调试程序时经常使用的宏,在程序运行时它计算括号内的表达式,如果表达式为FALSE (0), 程序将报告错误,并终止执行。如果表达式不为0,则继续执行后面的语句。这个宏通常原来判断程序中是否出现了明显非法的数据,如果出现了终止程序以免导致严重后果,同时也便于查找错误。   原型定义: #include <assert.h> void assert( int expre

notepad++ 正则表达式多条件查找替换

基础语法参考: https://www.cnblogs.com/winstonet/p/10635043.html https://www.linuxidc.com/Linux/2019-05/158701.htm   通常情况下我们查找的内容和要被替换掉的内容是一样的,我们只需要使用正则表达式精确框定查找内容,替换直接输入要替换的内容即可。 但有时会比较复杂,查找的内容,只需要替换其中

js正则表达式test方法的问题

今天在网上碰到一个帖子,写了一个关于Regex的奇怪现象,(文章来源http://www.php100.com/html/webkaifa/javascript/2007/0109/1866.html) 代码如下 <script type="text/javascript"><!--var re = /^\d+(?:\.\d)?$/ig; alert(re.test('112.3'

Java利用正则表达式获取指定两个字符串之间的内容

package com.starit.analyse.util;import java.text.SimpleDateFormat;import java.util.ArrayList;import java.util.List;import java.util.regex.Matcher;import java.util.regex.Pattern;public class DealSt

python+selenium2学习笔记unittest-03断言

断言的方法网上归纳的很多主要有以下这些 断言语法解释assertEqual(a, b) 判断a==bassertNotEqual(a, b)判断a!=bassertTrue(x)bool(x) is TrueassertFalse(x)bool(x) is FalseassertIs(a, b)a is bassertIsNot(a, b) a is not bassertIsNone(x) x

AS3中正则表达式中如何表达“或”

var reg:RegExp=/\r|\n|\t/g;                 var msg:String="123\rabc\n\tabc\ta\123";                 msg=msg.replace(reg,"");                 trace(msg);