剑指offer系列之五十一:正则表达式匹配

2024-05-30 16:58

本文主要是介绍剑指offer系列之五十一:正则表达式匹配,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目描述

请实现一个函数用来匹配包括’.’和’*’的正则表达式。模式中的字符’.’表示任意一个字符,而’*’表示它前面的字符可以出现任意次(包含0次)。 在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串”aaa”与模式”a.a”和”ab*ac*a”匹配,但是与”aa.a”和”ab*a”均不匹配

由于只涉及两种正则表达式的匹配,所以关键是需要分清除匹配的所有情况,对于模式串来讲,出现了’.’和’*’的时候需要单独考虑,因为两者的匹配情况是不一样的。先考虑模式串中有’*’的情况,因为’*’可以匹配0个或者多个,所以如果模式串的下一个字符是’*’的时候就有三种情况:1)匹配0个主串的字符,比如主串是abc,模式串是b*的时候,就是这种情况,那么下一步的匹配策略是主串保持不变,模式串跳到下两个字符重新比较;2)匹配1个字符,比如主串是abc,模式串是a*就是这种情况,因为只匹配到了a这一个字符。这种情况的下一步的比较策略应该是主串跳到下一个字符,模式串移动两个位置;3)匹配多个字符,比如主串是aac,模式串是a*cb就匹配到了aa这两个字符,那么这种情况下下一步的匹配策略应该是主串移动一个字符,模式串移动两个位置;如果当前的字符与主串的字符不能匹配,则主串保持不变,模式串移动两个位置。如果当前字符是’.’的话,直接逐个字符进行比较就行了。下面是这种思路的实现代码(已被牛客AC):

package com.rhwayfun.offer;public class MatchRegString {public boolean match(char[] str, char[] pattern) {if (str == null || pattern == null)return false;return matchRegCore(str, 0, str.length, pattern, 0, pattern.length);}private boolean matchRegCore(char[] str, int i, int length1,char[] pattern, int j, int length2) {if (i == length1 && j == length2) {// 主串匹配到末尾,模式串要么也匹配到末尾要么当前位置的字符是*,否则返回falseif (j == length2 || pattern[j] == '*')return true;elsereturn false;}if (i != length1 && j == length2)return false;/** 一、如果模式串的下一个字符是*, 1.1 并且模式串的当前字符能与主串的字符进行匹配,则可能出现三种情况:* 1、模式串的当前字符匹配到0个字符,则主串不变,模式穿移动到两个字符* 2、模式穿的当前字符匹配到1个字符,则主串移动一个位置,模式串移动两个位置* 3、模式串的当前字符匹配到多个字符,则主串移动一个位置,模式串移动两个位置。 1.2 如果不能匹配的话: 主串不变,模式串移动两个位置;* 二、如果下一个字符不是*,则进行逐个字符进行匹配 三、如果模式串的下一个字符是.,则就进行一个字符的匹配*/if (j + 1 < length2 && pattern[j + 1] == '*') {if (i < length1 && (pattern[j] == str[i] || pattern[j] == '.')) {return matchRegCore(str, i + 1, length1, pattern, j, length2)|| matchRegCore(str, i + 1, length1, pattern, j + 2,length2)|| matchRegCore(str, i, length1, pattern, j + 2,length2);} else {return matchRegCore(str, i, length1, pattern, j + 2, length2);}}if (i < length1 && (str[i] == pattern[j] || pattern[j] == '.')) {return matchRegCore(str, i + 1, length1, pattern, j + 1, length2);}return false;}public static void main(String[] args) {char[] str = { 'a', 'a', 'a' };char[] pattern = { 'a', 'b', '*', 'a' };boolean b = new MatchRegString().match(str, pattern);System.out.println(b);}
}

这篇关于剑指offer系列之五十一:正则表达式匹配的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1016572

相关文章

Nginx中location实现多条件匹配的方法详解

《Nginx中location实现多条件匹配的方法详解》在Nginx中,location指令用于匹配请求的URI,虽然location本身是基于单一匹配规则的,但可以通过多种方式实现多个条件的匹配逻辑... 目录1. 概述2. 实现多条件匹配的方式2.1 使用多个 location 块2.2 使用正则表达式

golang字符串匹配算法解读

《golang字符串匹配算法解读》文章介绍了字符串匹配算法的原理,特别是Knuth-Morris-Pratt(KMP)算法,该算法通过构建模式串的前缀表来减少匹配时的不必要的字符比较,从而提高效率,在... 目录简介KMP实现代码总结简介字符串匹配算法主要用于在一个较长的文本串中查找一个较短的字符串(称为

C++使用栈实现括号匹配的代码详解

《C++使用栈实现括号匹配的代码详解》在编程中,括号匹配是一个常见问题,尤其是在处理数学表达式、编译器解析等任务时,栈是一种非常适合处理此类问题的数据结构,能够精确地管理括号的匹配问题,本文将通过C+... 目录引言问题描述代码讲解代码解析栈的状态表示测试总结引言在编程中,括号匹配是一个常见问题,尤其是在

关于Gateway路由匹配规则解读

《关于Gateway路由匹配规则解读》本文详细介绍了SpringCloudGateway的路由匹配规则,包括基本概念、常用属性、实际应用以及注意事项,路由匹配规则决定了请求如何被转发到目标服务,是Ga... 目录Gateway路由匹配规则一、基本概念二、常用属性三、实际应用四、注意事项总结Gateway路由

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

hdu 3065 AC自动机 匹配串编号以及出现次数

题意: 仍旧是天朝语题。 Input 第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。 接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。 在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。