Python正则表达式书写容易碰到的陷阱:\W*和\W*?匹配过程遇到的问题
2023-09-27 14:26:59 时间
老猿在分析《Python正则表达式\W+和\W*匹配过程的深入分析》中的问题时,想到一个问题,如果“re.split(’(\W*)’,‘Hello,world’)”的处理如果换成非贪婪模式会怎么样,根据老猿的预测,由于在’Hello,world’中没有连续的非单词字符,因此贪婪模式处理和非贪婪模式结果应该一样,如是测试了一下看看效果:
>>> re.split('(\W*)','Hello,world') #贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['Hello,world']
>>>
看到这结果老猿完全懵圈了,这完全推翻了《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程。但执行结果肯定是正常的,肯定是老猿自己的问题,大家觉得问题出在哪里呢?
不卖关子了,《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程应该是没有问题的,问题出在输入的问号上,半角的问号被输入成了全角问号,导致匹配不到对应的搜索文本,所以就将原串作为列表的元素整个返回了。其实结果也告诉我们没有分割成功,结果中的元素只有一个,而不是两个,因为它们是一个单引号标记的字符串。只是才开始老猿没仔细看,把字符串中间的逗号看成了元素分割的逗号,才闹了这么个乌龙。上述语句真正的非贪婪模式执行结果如下:
>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', '', '', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
看起来与“re.split(’(\W*)’,‘Hello,world’)”贪婪模式的结果相同,其实还是有些不同的,这个不同点正好体现出贪婪模式和非贪婪模式的区别,具体是怎么回事感兴趣的可以分析一下。
这个案例类似的场景老猿遇到过多次,写出来聊博大家一笑。
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
请大家多多支持,点赞、评论和加关注!谢谢!
相关文章
- Python中Matplotlib模块的简单使用
- python 自动化数据提取之正则表达式
- [小小明]Python正则表达式速查表与实操手册
- Python import re正则表达式个人常用记录
- 【华为OD机试真题 python】 矩形相交的面积【2022 Q4 | 100分】
- 130 python高级 - 正则表达式概述
- Python Docs
- gyp ERR! stack Error: Can‘t find Python executable “python“, you can set the PYTHON env variable.
- python学习之定制发送带附件的电子邮件
- python正则表达式应用 重组分词
- python 正则表达式语法
- python 正则表达式匹配过程
- python正则表达式1
- 5. python爬虫——基于正则表达式获取糗事百科多个页面上的图片
- 使用argparse改变python文件中的变量
- 【Leetcode 】21:合并两个有序链表(Python)
- python五十八课——正则表达式(替换)
- Python Unicode字符串
- Python read和write方法