您现在的位置是：首页 > 后端

当前栏目

python正则表达式2

Python 正则表达式

2023-09-11 14:19:51 时间

匹配电话号码:

 1 >>> import re
 2 >>> pattern=r'\d{3,4}-?\d{8}'
 3 >>> re.findall( pattern, '021-12345678' )
 4 ['021-12345678']
 5 >>> re.findall( pattern, '02188888888' )
 6 ['02188888888']
 7 >>> re.findall( pattern, '0218888888' )
 8 []
 9 >>> re.findall( pattern, '021-8888888' )
10 []
11 >>>

把正则表达式，编程成一个对象，可以提高匹配效率

>>> patterTel=re.compile( pattern )
>>> patterTel
<_sre.SRE_Pattern object at 0x7fd19ba5ab90>
>>> patterTel.findall( '021-88888888' )
['021-88888888']
>>>

可以通过编译成对象，传参(re.I)，把匹配方式改成忽略大小

 1 >>> pattern=r'[a-z]+'
 2 >>> re.findall( pattern, 'abc' )
 3 ['abc']
 4 >>> re.findall( pattern, 'aBc' )
 5 ['a', 'c']
 6 >>> re.compile( pattern, re.I )
 7 <_sre.SRE_Pattern object at 0x7fd19b906490>
 8 >>> cPattern = re.compile( pattern, re.I )
 9 >>> cPattern.findall( 'aBc' )
10 ['aBc']
11 >>>

match，匹配到的字符是否在被匹配字符串的开头，如果是，返回一个对象.

>>> pattern=r'abc'
>>> re.match( pattern, 'ghostwu abc' )
>>> re.match( pattern, 'abc ghostwu' )
<_sre.SRE_Match object at 0x7fd19b96c780>
>>> re.match( pattern, ' abc ghostwu' )
>>> res = re.match( pattern, 'abc ghostwu' )
>>> if res:
...     print '是以abc开头的'
... else:
...     print '不是以abc开头的'
... 
是以abc开头的
>>>

search：存在就返回对象

>>> pattern=r'abc'
>>> re.search( pattern, 'abc ghostwu' )
<_sre.SRE_Match object at 0x7fd19b96c850>
>>> re.search( pattern, 'ghostwu abc' )
<_sre.SRE_Match object at 0x7fd19b96c780>
>>> re.search( pattern, 'ghostwu abc def' )
<_sre.SRE_Match object at 0x7fd19b96c850>
>>> re.search( pattern, 'ghostwu def' )
>>>

finditer返回一个迭代器，findall返回的是列表

>>> pattern=r'abc'
>>> iterator=re.finditer( pattern, 'abc def abc ghostwu abc' )
>>> iterator.next()
<_sre.SRE_Match object at 0x7fd19b96c780>
>>> iterator.next()
<_sre.SRE_Match object at 0x7fd19b96c850>
>>> iterator.next()
<_sre.SRE_Match object at 0x7fd19b96c780>
>>> iterator.next()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
>>>

group方法，可以查看match匹配到的值

>>> pattern=r'abc'
>>> res=re.match( pattern, 'abc ghostwu abc' )
>>> res
<_sre.SRE_Match object at 0x7fd19b96c850>
>>> res.group()
'abc'

同样可用于迭代器返回的对象

>>> pattern=r'abc'
>>> re.finditer( pattern, 'abc ghostwu abc abc hello' )
<callable-iterator object at 0x7fd19b982190>
>>> res = re.finditer( pattern, 'abc ghostwu abc abc hello' )
>>> res.next().group()
'abc'
>>> res.next().group()
'abc'
>>> res.next().group()
'abc'
>>> res.next().group()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
>>>

re.sub:替换

>>> str='hello abc'
>>> str.replace( 'abc', 'ghostwu' )
'hello ghostwu'
>>> str
'hello abc'
>>> re.sub( r'abc', 'ghostwu', str )
'hello ghostwu'
>>>

把小写的(r,s,t)字母换成大写的R

>>> str='ghostwu:hi,nice to meet you!'
>>> re.sub( r'[r-t]', 'R', str )
'ghoRRwu:hi,nice Ro meeR you!'
>>>

>>> str=r'jfsdaft jdfasfcxvt jfdsafdast'
>>> pattern=r'j.*t?'
>>> re.sub( pattern, 'javascript', str )
'javascript'
>>> re.subn( pattern, 'javascript', str )
('javascript', 1)

subn：结果中多了一个数字，表示一共替换了多少次

split:切割

>>> ip='127.0.0.1'
>>> ip.split( '.' )
['127', '0', '0', '1']
>>> pattern='\.'
>>> re.split( pattern, ip )
['127', '0', '0', '1']

>>> str="hello, my name is ghostwu"
>>> pattern=r'[\s,]'
>>> re.split( pattern, str )
['hello', '', 'my', 'name', 'is', 'ghostwu']
>>>

如果分割符号的形式不同，用正则的split是比较方便的

猜你喜欢

CA认证以及https的实现
【算法】【递归与动态规划模块】斐波那契数列的系列问题解法及递推类型问题的最优解
linux7安装elasticsearch-7.4.0集群配置
nyoj 242-计算球体积 (pi*r*r*r*4/3)
calico网络 pod 网关 default via 169.254.1.1 dev eth0
Asp.Net MVC学习总结之过滤器详解（转载）
学习如何看懂SQL Server执行计划——基本知识篇
《企业大数据系统构建实战：技术、架构、实施与应用》一2.2　大数据职位构建体系
附加数据库后，数据库状态为只读
java.util.concurrent简介
萦绕于指尖的节奏：今天，我们来聊聊机械键盘
【数字IC验证快速入门】45、UVM项目实践之APB_SPI（13）UVM 验证方法学总结
HTTP原理
基于单片机的智能电饭煲控制系统的设计（附代码）
计算机等级考试二级C语言程序设计专项训练题——单链表
组合投资的风险与收益概述

相关主题

python爬虫图片
「Python」正则表达式
Python re正则表达式
12 Python正则表达式
python常见异常
python中的is和==

zl程序教程

当前栏目

python正则表达式2

相关文章