本文主要是介绍Datawhale-爬虫-Task2(正则表达式),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
学习内容
- 什么是正则表达式
- 案例
什么是正则表达式
- 定义:一套规则,可以在字符串文本中进行搜查替换等
- 使用步骤:
- 1.使用
compile()
函数将正则表达式的字符串编译成一个pattern
对象 - 2.通过
pattern
对象的一些方法对文本进行匹配,匹配结果是一个match
对象 - 3.用
match
对象的方法,对结果进行操作
- 1.使用
- 常用方法:
- match:从开始位置开始查找,一次匹配,即1次匹配成功则退出
一般使用形式:
match(string[,pos[,endpos]])
- search:从任何位置开始查找,一次匹配
search[string[, pos[, endpos]]]
例子:
- match:从开始位置开始查找,一次匹配,即1次匹配成功则退出
>>>import re
>>>pattern = re.compile(r'\d+') #用于匹配至少一个数字>>>m = pattern.match('one12twothree34four') #查找头部,没有匹配
>>>print(m) #输出None>>>m = pattern.match('one12twothree34four', 2, 10) #从'e'的位置开始匹配,没有匹配到
>>>print(m)
>>>m = pattern.match('one12twothree34four', 3, 10) #从'1' 的位置开始匹配,正好匹配上
>>>print(m)
<_sre.SRE_Match object at 0x10a42aac0>
>>>m.group(0) #可忽略0
'12'
>>>m.start(0) #可忽略0
3
>>>m.end(0) #可忽略0
5
>>>m.span(0) #可忽略0
(3, 5)>>>m = pattern.search('one12twothree34four') #这里如果使用match方法则不匹配
这篇关于Datawhale-爬虫-Task2(正则表达式)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!