Ruby语言中的String深入理解
2023-06-13 09:14:26 时间
Ruby语言中的String是mutable的,不像java、C#中的String是immutable的。比如
复制代码代码如下:
str1="abc"
str2="abc"
在java中,对于字面量的字符串,jvm内部维持一张表,因此如果在java中,str1和str2是同一个String对象。而在Ruby中,str1和str2是完全不同的对象。同样,在java中对于String对象的操作都将产生一个新的对象,而Ruby则是操纵同一个对象,比如:
str="abc"
str.concat("cdf")
此时str就是"abccdf"。Ruby对String是怎么处理的呢?我们只谈谈cruby中的实现,有兴趣的先看看这篇文章《管窥Ruby——对象基础》。在ruby.h中我们可以看到String对象的结构,Ruby中的对象(包括类也是对象)都是一个一个的struct,String也不能例外:
structRString{
structRBasicbasic;
longlen;
char*ptr;
union{
longcapa;
VALUEshared;
}aux;
};
//ruby.h
显然,len是String的长度;ptr是一个char类型的指针,指向实际的字符串;然后是一个联合,这个稍后再说。如果你看看ruby.h可以发现,几乎所有定义的对象结构都有一个structRBasic。显然,structRBasic包含由所有对象结构体共享的一些重要信息的。看看RBasic:
structRBasic{
unsignedlongflags;
VALUEklass;
};
其中的flags是一个多用途的标记,大多数情况下用于记录结构体的类型,ruby.h中预定义了一些列的宏,比如T_STRING(表示structRString),T_ARRAY(表示structRArray)等。Klass是一个VALUE类型,VALUE也是unsignedlong,可以地将它当成指针(一个指针4字节,绰绰有余了),它指向的是一个Ruby对象,这里以后再深入。
那么联合aux中的capa和shared是干什么用的呢?因为Ruby的String是可变的,可变意味着len可以改变,我们需要每次都根据len的变换来增减内存(使用c中的realloc()函数),这显然是一个很大的开销,解决办法就是预留一定的空间,ptr指向的内存大小略大于len,这样就不需要频繁调用realloc了,aux.capa就是一个长度,包含额外的内存大小。那么aux.shared是干什么的呢?这是一个VALUE类型,说明它是指向某个对象。aux.shared其实是用于加快字符串的创建速度,在一个循环中:
ruby代码
whiletruedo重复a="str"#以“str”为内容创建字符串,赋值给aa.concat("ing")#为a所指向的对象添加“ing”p(a)#显示“string”end
每次都重新创建一个"str"对象,内部就是重复创建一个char[],这是相当奢侈,aux.shared就是用于共享char[],以字面量创建的字符串会共享一个char[],当要发生变化时,将字符串复制到一个非共享的内存中,变化针对这个新拷贝进行,这就是所谓的“copy-on-write"技术。解释了String的内部构造,貌似还没有介绍String是怎么实现mutable,我们写一个Ruby扩展测试下,我们想写这样一个Ruby类:
ruby代码
classTestdefteststr="str"str.concat("ing")endend
对应的c语言代码就是:
cpp代码
#include
#include"ruby.h"staticVALUEt_test(VALUEself){
VALUEstr;str=rb_str_new2("str");
printf("beforeconcat:str:%p,
str.aux.shared:%p,str.ptr:%s"n",str,(RSTRING(str)->aux).shared,RSTRING(str)->ptr);
rb_str_cat2(str,"ing");
printf("afterconcat:str:%p,str.aux.shared:%p,str.ptr:%s"n",
str,(RSTRING(str)->aux).shared,RSTRING(str)->ptr);returnself;
}
VALUEcTest;
voidInit_string_hack(){
cTest=rb_define_class("Test",rb_cObject);
rb_define_method(cTest,"test",t_test,0);
}//string_hack.c
rb_define_class函数定义了一个类Test,rb_define_method将t_test方法以test的名称添加到Test类。在t_test中,通过rb_str_new2每次生成一个RString结构,然后通过rb_str_cat2将str与"ing"连接起来,添加了一些打印用于跟踪。利用mkmf产生Makefile,写一个extconf.rb
ruby代码
require"mkmf"create_makefile("string_hack");
执行rubyextconf.rb,将产生一个Makefile,执行make,生成一个string_hack.so的链接库。扩展写完了,通过ruby调用:
ruby代码
require"string_hack"t=Test.new(1..3).each{|i|t.test}
输出:
beforeconcat:str:0x40098a40,str.aux.shared:0x3,str.ptr:str
afterconcat:str:0x40098a40,str.aux.shared:0x8,str.ptr:string
beforeconcat:str:0x40098a2c,str.aux.shared:0x3,str.ptr:str
afterconcat:str:0x40098a2c,str.aux.shared:0x8,str.ptr:string
beforeconcat:str:0x40098a18,str.aux.shared:0x3,str.ptr:str
afterconcat:str:0x40098a18,str.aux.shared:0x8,str.ptr:string
从结果可以看出,在strconcat之前之后,str指向的位置没有改变,改变的仅仅是str中ptr指向的字符串的值,看看rb_str_cat2函数的实现就一目了然了:
cpp代码
VALUErb_str_cat(str,ptr,len)VALUEstr;
constchar*ptr;
longlen;
{
if(len<0){rb_raise(rb_eArgError,"negativestringsize(orsizetoobig)");
}
if(FL_TEST(str,STR_ASSOC))
{
rb_str_modify(str);
REALLOC_N(RSTRING(str)->ptr,char,RSTRING(str)->len+len);
memcpy(RSTRING(str)->ptr+RSTRING(str)->len,ptr,len);
RSTRING(str)->len+=len;
RSTRING(str)->ptr[RSTRING(str)->len]=""0";
/*sentinel*/
returnstr;
}
returnrb_str_buf_cat(str,ptr,len);
}
VALUErb_str_cat2(str,ptr)VALUEstr;
constchar*ptr;
{
returnrb_str_cat(str,ptr,strlen(ptr));
}
//string.c
相关文章
- 红袖添香,绝代妖娆,Ruby语言基础入门教程之Ruby3基础数据类型(data types)EP02
- 【Ruby高级技术】在项目中使用多线程之后的一系列问题解决方案-同步控制、异常处理、死锁处理
- 使用Ruby脚本部署Redis Cluster集群步骤讲解
- 从Redis到Ruby:一次零基础的技术探索(redisruby)
- Streem:Ruby之父开发的新脚本语言
- Ruby 2.2.0发布,支持增量式垃圾收集和符号的垃圾收集
- Ruby on Rails 5.0 发布
- Ruby中的一元操作符(-,+,*,&,!)的重载
- Ruby中的闭包:Block,Proc,lambda的联系与区别
- 详解 Linux 下 Ruby 安装步骤(linux下ruby安装)
- Ruby安装MySQL:从零开始(ruby安装mysql)
- 两种技术的融合借助 Ruby 与 Redis 实现强大的数据处理(ruby和redis)
- 红宝石与红宝石完美结合(redis跟ruby)
- 什么是ruby和Ruby概述
- ruby学习笔记(2)类的基本使用
- RUBY新手教程跟我一起学ruby
- ruby声明式语法的实现例子
- openSUSE下的Ruby安装openssl出错解决方法
- ruby执行周期性任务的三种gem介绍
- Ruby迭代器的7种技巧分享
- Ruby中的public、private、protected区别小结