Python 正则表达式(匹配多个字符)- 寻找香烟smoke的故事

本文主要是介绍Python 正则表达式(匹配多个字符)- 寻找香烟smoke的故事,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

仅供学习,转载请注明出处

匹配多个字符

思考

  • 场景:胖子老板在写字板写了一大堆东西,判断是否存在smoke的语句,判断正确就可以送你一包烟。

前面篇章讲到了如何匹配单个字符,但是却不能完美解决胖子老板提出的这个问题。那么当然就要继续增加技能点,来解决这个问题啦。

匹配多个字符的相关格式

字符功能
*匹配前一个字符出现0次或者无限次,即可有可无
+匹配前一个字符出现1次或者无限次,即至少有1次
?匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{m}匹配前一个字符出现m次
{m,n}匹配前一个字符出现从m到n次

匹配前一个字符出现0次或者无限次,即可有可无: *

# 首先匹配一个单字符大写M来热热身
In [8]: re.match("M","M").group()                                              
Out[8]: 'M'# 当小写m来匹配大写M字符的时候,淡定报错
In [9]: re.match("m","M").group()                                              
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-9-a22cd8e2da84> in <module>
----> 1 re.match("m","M").group()AttributeError: 'NoneType' object has no attribute 'group' # 使用 [] 的方法,来同时匹配大小写m
In [10]: re.match("[mM]","M").group()                                          
Out[10]: 'M'In [11]:    # 再来匹配大小写 a到z 的字母,当然这也是匹配一个字符而已,那么怎么匹配多个字符呢?
In [11]: re.match("[a-zA-Z]","M").group()                                      
Out[11]: 'M'In [12]: # 增加一个 * 号,那样就可以匹配出多个大小写字母了。
In [13]: re.match("[a-zA-Z]*","Mmasd").group()                                 
Out[13]: 'Mmasd'# 如果不用 * 号,那么一个 [] 只能匹配一个字符,这里写了两个 [] ,那么当然就是匹配出两个字符了。
In [14]: re.match("[a-zA-Z][a-zA-Z]","Mmasd").group()                          
Out[14]: 'Mm'In [15]:     # 那么来想一下,使用大小写字母来匹配数字,肯定会报错。那么加个 * 号 会不会报错呢?
In [15]: re.match("[a-zA-Z]","123456").group()                                 
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-15-68dd0d7f6c8c> in <module>
----> 1 re.match("[a-zA-Z]","123456").group()AttributeError: 'NoneType' object has no attribute 'group'# 从结果来看,是没有报错的。因为 * 号的原因就是匹配前面的字符是否存在0次,或者多次的情况。这次匹配就是0次,那么直接就返回空字符串了。
In [16]: re.match("[a-zA-Z]*","123456").group()                                
Out[16]: ''In [17]:     

匹配前一个字符出现1次或者无限次,即至少有1次: +

# 上面用 * 号的时候,匹配不到直接返回空字符串,则没有报错。
# 那么换成 + 号就报错了,因为 + 号是一定至少需要有一个字母来匹配的。
In [17]: re.match("[a-zA-Z]+","123456").group()                                
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-17-c8ba700cee8c> in <module>
----> 1 re.match("[a-zA-Z]+","123456").group()AttributeError: 'NoneType' object has no attribute 'group'# 那么改成 * 号,允许0次字母匹配。再加 \d 至少一个或者多个数字匹配,淡定OK
In [19]: re.match("[a-zA-Z]*\d+","123456").group()                             
Out[19]: '123456'In [20]:   

匹配前一个字符出现1次或者0次,即要么有1次,要么没有:?

有时候匹配一个字符不知道到底有没有的时候,就可以使用 ? 号处理,如下:

# 再最后增加一个下划线来匹配,淡定发现报错。
In [20]: re.match("[a-zA-Z]*\d+_","123456").group()                            
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-20-5266a50cf59d> in <module>
----> 1 re.match("[a-zA-Z]*\d+_","123456").group()AttributeError: 'NoneType' object has no attribute 'group'# 在下划线后面增加一个 ? 号,来设置不知道有没有下划线
In [21]: re.match("[a-zA-Z]*\d+_?","123456").group()                           
Out[21]: '123456'# 那么如果有下划线,就会把下划线匹配出来
In [22]: re.match("[a-zA-Z]*\d+_?","123456_").group()                          
Out[22]: '123456_'In [23]: re.match("[a-zA-Z]*\d+_?","123456_12312").group()                     
Out[23]: '123456_'In [24]:  

匹配一个 0 至 99 的数字:

# 如果直接匹配两个字符 [] [] ,那当然会报错
In [24]: re.match("[0-9][0-9]","1").group()                                    
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-24-b9459313bc26> in <module>
----> 1 re.match("[0-9][0-9]","1").group()AttributeError: 'NoneType' object has no attribute 'group'# 给第一个[] 设置 ?号,那么就可以判断可能不存在第一个字符,只有一个。
In [25]: re.match("[0-9]?[0-9]","1").group()                                   
Out[25]: '1'In [26]: re.match("[0-9]?[0-9]","11").group()                                  
Out[26]: '11'In [27]: re.match("[0-9]?[0-9]","99").group()                                  
Out[27]: '99'In [28]:   In [53]: re.match("[0-9]?\d","09").group()                                     
Out[53]: '09'

匹配前一个字符出现m次:{m}

需求:匹配出,8到20位的密码,可以是大小写英文字母、数字、下划线

# 首先匹配大小写字母,数字,下划线 使用 \w 即可
In [55]: re.match("\w","a").group()                                            
Out[55]: 'a'In [56]: re.match("\w","A").group()                                            
Out[56]: 'A'In [57]: re.match("\w","1").group()                                            
Out[57]: '1'In [58]: re.match("\w","_").group()                                            
Out[58]: '_'# 那么就是需要确定匹配多少个,这时候使用{ 8,20 } 即可匹配8到20位这个 \w  的字符了。
In [62]: re.match("\w{8,20}","123").group()                                    
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-62-24a5057f6d58> in <module>
----> 1 re.match("\w{8,20}","123").group()AttributeError: 'NoneType' object has no attribute 'group'In [63]:                                                                       In [63]: re.match("\w{8,20}","12345678").group()                               
Out[63]: '12345678'In [64]: re.match("\w{8,20}","12345678aAhjjhc____").group()                    
Out[64]: '12345678aAhjjhc____'In [65]:  

匹配出163的邮箱地址

@符号之前有4到20位大小写字符、数字、以及下划线,开头必须是字母,不能是下划线、数字。
正确 :fatboy@163.com
错误: 1ajsdhj@163.comm

In [68]: re.match('[a-zA-Z]\w{3,19}@163.com','fatboy@163.com').group()         
Out[68]: 'fatboy@163.com'In [69]:    In [70]: re.match('[a-zA-Z]\w{3,19}@163.com','1fatboy@163.com').group()        
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-70-020ba8a3bbe7> in <module>
----> 1 re.match('[a-zA-Z]\w{3,19}@163.com','1fatboy@163.com').group()AttributeError: 'NoneType' object has no attribute 'group'In [71]:     

寻找smoke的胖老板题目 - 使用findall方法

如下:

ajsdlka;sjd;lkjas;dlkujqoiueioujasldkasjlkdasdljkhalalksj;dla,msdmnas;lkdkasmdkl;amsx,.asjdklsomkeaskldjkalsjdklasmd,mxznjhsaioduoiwuasdjhkljasmnxnlkjsxhjalsdnkjlasbldkjnasdjnajsldnajlskdsmokeasjdlka;sjd;lkjasd;lkjasdsmokesmoke

问在这里面有多少个smoke?

In [86]: question = "ajsdlka;sjd;lkjas;dlkujqoiueioujasldkasjlkdasdljkhalalksj;...: dla,msdmnas;lkdkasmdkl;amsx,.asjdklsomkeaskldjkalsjdklasmd,mxznjhsaiod...: uoiwuasdjhkljasmnxnlkjsxhjalsdnkjlasbldkjnasdjnajsldnajlskdsmokeasjdlk...: a;sjd;lkjasd;lkjasdsmokesmoke"                                        In [87]: result = re.findall('smoke',question)                                 In [88]: print(len(result))                                                    
3In [89]: print(result)                                                         
['smoke', 'smoke', 'smoke']In [90]:    
13423234-562bf071aa22f9dd.gif
胖子老板:你哪里get到这个findall方法的,前面都没说啊

别着急,我后面继续写。

13423234-7907ae6344e86e8a.png

关注微信公众号,回复【资料】、Python、PHP、JAVA、web,则可获得Python、PHP、JAVA、前端等视频资料。

这篇关于Python 正则表达式(匹配多个字符)- 寻找香烟smoke的故事的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1092188

相关文章

Python如何使用__slots__实现节省内存和性能优化

《Python如何使用__slots__实现节省内存和性能优化》你有想过,一个小小的__slots__能让你的Python类内存消耗直接减半吗,没错,今天咱们要聊的就是这个让人眼前一亮的技巧,感兴趣的... 目录背景:内存吃得满满的类__slots__:你的内存管理小助手举个大概的例子:看看效果如何?1.

Python+PyQt5实现多屏幕协同播放功能

《Python+PyQt5实现多屏幕协同播放功能》在现代会议展示、数字广告、展览展示等场景中,多屏幕协同播放已成为刚需,下面我们就来看看如何利用Python和PyQt5开发一套功能强大的跨屏播控系统吧... 目录一、项目概述:突破传统播放限制二、核心技术解析2.1 多屏管理机制2.2 播放引擎设计2.3 专

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Python实现无痛修改第三方库源码的方法详解

《Python实现无痛修改第三方库源码的方法详解》很多时候,我们下载的第三方库是不会有需求不满足的情况,但也有极少的情况,第三方库没有兼顾到需求,本文将介绍几个修改源码的操作,大家可以根据需求进行选择... 目录需求不符合模拟示例 1. 修改源文件2. 继承修改3. 猴子补丁4. 追踪局部变量需求不符合很

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

在C#中调用Python代码的两种实现方式

《在C#中调用Python代码的两种实现方式》:本文主要介绍在C#中调用Python代码的两种实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#调用python代码的方式1. 使用 Python.NET2. 使用外部进程调用 Python 脚本总结C#调

Python下载Pandas包的步骤

《Python下载Pandas包的步骤》:本文主要介绍Python下载Pandas包的步骤,在python中安装pandas库,我采取的方法是用PIP的方法在Python目标位置进行安装,本文给大... 目录安装步骤1、首先找到我们安装python的目录2、使用命令行到Python安装目录下3、我们回到Py

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应