Perl处理数据(二):tr和y///
tr和y///
是等价的。用来实现一一映射,但也有额外的功能,就像Linux下的tr命令一样。
用法:
tr/SEARCH/REPLACEMENT/cdsr
y/SEARCH/REPLACEMENT/cdsr
其中:
c:取search的补集,将search中未找到的字符全都替换成replacement的最后一个字符
d:删除search中出现的字符
s:压缩重复字符,仅仅只需要压缩不需要替换时,可将replacement指定为空
r:返回的不是替换成功的数量,而是替换成功后的内容,和s///的r修饰符是一样的
例如:
1.映射功能
将小写字母e替换为大写字母E。
$str="abcdef";
$str =~ y/e/E/;
print "$str\n";
将小写字母全替换为大写字母。
$str="abcdef";
$str =~ y/[a-z]/[A-Z]/;
print "$str\n";
如果对同一个字母指定不同的映射集,那么第一个映射将生效。
$str="aaa ddd eee fff";
$str =~ tr/aaa/xyz/;
print "$str\n"; # 输出xxx ddd eee fff
2.使用r返回替换后的结果
该修饰符使得处理数据前会先拷贝一份数据,然后对副本数据进行操作,所以原始数据会保持不变。
$str="abcdef";
print $str =~ y/e/E/r;
print $str,"\n";
所以,可以将r修饰符的操作结果赋值给其它变量。
$str="abcde";
$copy = $str =~ y/e/E/r;
print $copy,"\n";
print $str,"\n";
3.用s修饰符压缩字符
$str="abc ddd eee ffff";
print $str =~ tr/ //sr;
可以压缩换行符:
$str1="abc\n\nddd\neee fff";
print $str1 =~ tr/\n //sr;
4.d修饰符删除search中有,但replacement中没有的字符
也就是保留replacement的字符,其余删掉。
例如,直接删除某些字符,不指定replacement,那么search中的字符都被删除。
$str="abc ddd eee fff";
$str =~ y/de//d;
print qq("$str"); # 输出:"abc fff"
$str="abc ddd eee fff";
$str =~ y/de/e/d; # e被保留
print qq("$str");
关于d修饰符,有些复杂。如果search部分指定的不是精确的字符,那么被编译时就不知道是哪些字符需要查找,也就无法从replacement中找到哪些字符需要保留,从而replacement部分变得多余。
$str="abc ddd eee fff";
$str =~ y/[d-f]/e/d; # e不会被保留,得到"abc "
$str =~ y/[def]/e/d; # e不会被保留
$str =~ y/[df]e/e/d; # e不会被保留
5.c修饰符取补集,将search中未指定的字符全部替换为replacement中的最后一个字符
$str="aaa bbb ccc ddd";
print $str =~ y/ab/xy/cr; # aaaybbbyyyyyyyy
注意上面,除了a和b外,全都替换成了y字符,x字符被忽略。
如果replacement比search长,则仍然是取replacement的最后一个字符作为替换字符。所以下面的等价:
y/ab/xy/c;
y/ab/zxy/c
所以,指定一个补集的替换字符即可。
如果同时指定了s修饰符,则补集替换后,再压缩。
$str="aaa bbb ccc ddd";
print $str =~ y/ab/xy/scr; # aaaybbby
如果指定了d修饰符,则删除所有未在searchlist中的字符,也就是说replacement部分成了多余的:
$str="aaa bbb ccc ddd";
print $str =~ y/ab/xy/dcr; # aaabbb
6.c和d修饰符一起用时,一个取search的补集保留search,一个删除search,如何处理?
perl的y///
是保留search,但不作补集替换,也就是cd修饰符各生效一部分。也因此,replacement部分是多余的。
$str="abc ddd eee fff";
$str =~ y/df/x/cd;
print qq("$str"); # 返回:dddfff
相关文章
- pandas学习(数据分组与分组运算、离散化处理、数据合并)
- Laravel5.4框架中视图共享数据的方法详解
- 为什么说 Python 是数据科学的发动机(一)发展历程(附视频中字)
- 大数据为电商发展插上腾飞的翅膀
- thinkphp6:自定义异常处理使统一返回json数据(thinkphp6.0.5 / php 7.4.9)
- 【IOS-COCOS2D-X 游戏开发之九】COCOS2DX利用CCSAXPARSER解析XML数据&CCMUTABLEDICTIONARY使用与注意!
- Kotlin 朱涛-2 面向对象 类 继承 构造 嵌套类 数据类
- 大数据将使安全产品爆发式增长
- 数据缺失值的4种处理方法
- 如何进行大数据分析及处理_数据分析师
- ch5-处理数据,抽取-整理-推导
- 【STM32F429】第14章 UDP用户数据报协议基础知识
- SAP Spartacus 定义在app.module.ts里的providers依赖注入元数据何时得到处理
- Atitit attilax涉及到的大数据 数据分析 数据挖掘 ai人工智能的处理技术 目录 1.1. 大数据 机器视觉 图像处理 数据分析 数据挖掘 知识图谱 ai人工智能方面系列项目1 2.
- ML之FE:利用【数据分析+数据处理】算法对国内某平台上海2020年6月份房价数据集【12+1】进行特征工程处理(史上最完整,建议收藏)
- ML之DT:基于DT决策树算法(对比是否经特征筛选FS处理)对Titanic(泰坦尼克号)数据集进行二分类预测
- ML之XGBoost:利用XGBoost算法对波士顿数据集回归预测(模型调参【2种方法,ShuffleSplit+GridSearchCV、TimeSeriesSplitGSCV】、模型评估)
- DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—训练过程
- android contentprovider增删改查(访问其他app的数据)
- 如何实时、高效地处理如此海量的路况数据?
- 3-39客户端(client)写数据到HDFS的流程
- 习题6.13 定义一个Student类,包含如下内容:成员变量:学号,姓名,性别,班干部否,数学,语文,外语 成员方法:输入,总分,平均分 编程实现这个类,并调用相应的方法输入数据,计算总分和平均分。
- 【大数据&人工智能】统计学入门——数据科学领域最需要了解的统计学基础概念
- 数据分析师是否有前途
- 自然语言处理(NLP)数据集汇总 2(附下载链接)
- 大数据Hadoop之——HDFS小文件问题与处理实战操作
- MATLAB处理excel表格中数据(一)读取和写入数据