您现在的位置是：首页 > 后端

当前栏目

Python正则表达式书写容易碰到的陷阱：\W和\W？匹配过程遇到的问题

Python 正则表达式过程遇到匹配容易陷阱书写

2023-09-27 14:26:59 时间

老猿在分析《Python正则表达式\W+和\W*匹配过程的深入分析》中的问题时，想到一个问题，如果“re.split(’(\W*)’,‘Hello，world’)”的处理如果换成非贪婪模式会怎么样，根据老猿的预测，由于在’Hello，world’中没有连续的非单词字符，因此贪婪模式处理和非贪婪模式结果应该一样，如是测试了一下看看效果：

>>> re.split('(\W*)','Hello，world') #贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', '，', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
>>> re.split('(\W*？)','Hello，world') #非贪婪模式
['Hello，world']
>>>

看到这结果老猿完全懵圈了，这完全推翻了《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程。但执行结果肯定是正常的，肯定是老猿自己的问题，大家觉得问题出在哪里呢？

不卖关子了，《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程应该是没有问题的，问题出在输入的问号上，半角的问号被输入成了全角问号，导致匹配不到对应的搜索文本，所以就将原串作为列表的元素整个返回了。其实结果也告诉我们没有分割成功，结果中的元素只有一个，而不是两个，因为它们是一个单引号标记的字符串。只是才开始老猿没仔细看，把字符串中间的逗号看成了元素分割的逗号，才闹了这么个乌龙。上述语句真正的非贪婪模式执行结果如下：

>>> re.split('(\W*?)','Hello，world') #非贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', '', '', '，', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']

看起来与“re.split(’(\W*)’,‘Hello，world’)”贪婪模式的结果相同，其实还是有些不同的，这个不同点正好体现出贪婪模式和非贪婪模式的区别，具体是怎么回事感兴趣的可以分析一下。

这个案例类似的场景老猿遇到过多次，写出来聊博大家一笑。

老猿Python，跟老猿学Python!
博客地址：https://blog.csdn.net/LaoYuanPython
请大家多多支持，点赞、评论和加关注！谢谢！

猜你喜欢

腾讯薪酬改革：晋升不再直接调薪；iPhone 4S 和 6S 将被列入过时产品；Perl 5.36.0发布|极客头条
js前端MD5加密（md5.js）
又一数据库高危漏洞爆出，数据安全如何有效保障？
接收来自路劲中的参数
使用堆实现Top K 算法 JS 实现
【MongoDB】基本语法
Android开发环境配置（win7_64bit）
C# 使用Emit深克隆
OGG-00664
perl中的grep函数介绍
JavaScript中的function使用方法
iphone 分辨率相关
2023年合肥市庐阳区信息学竞赛区赛小学组
UI自动化测试框架搭建 —— 添加Template方式定位元素
leetcode160 相交链表

相关主题

Python之生成器
Python装饰器 [1]
Python 中的单例
PYTHON路线图
h5 Python_python做h5网站
python 正则表达式
python死锁
python学习目录
python-format函数
Python 互斥锁

zl程序教程

当前栏目

Python正则表达式书写容易碰到的陷阱：\W和\W？匹配过程遇到的问题

相关文章

当前栏目

Python正则表达式书写容易碰到的陷阱：\W*和\W*？匹配过程遇到的问题

相关文章

Python正则表达式书写容易碰到的陷阱：\W和\W？匹配过程遇到的问题