zl程序教程

您现在的位置是:首页 >  后端

当前栏目

C++内存对象布局详解编程语言

2023-06-13 09:11:49 时间
C++将内存划分为三个逻辑区域:堆、栈和静态存储区。我们称位于它们之中的对象分别为

堆对象,栈对象以及静态对象。那么这些不同的内存对象有什么区别?堆对象和栈对象各

有什么优劣?如何禁止创建堆对象或栈对象?针对这些问题对C++内存对象的布局作些简单

介绍。

一.C++内存区域划分

a栈:一般用于存放局部变量或对象,如我们在函数定义中用类似下面语句声明的对象



Type stack_object ;

stack_object便是一个栈对象,生命周期是从定义点开始,函数返回时,结束。

几乎所有的临时对象都是栈对象。比如,下面的函数定义:

Type fun(Type object) ;

这个函数至少产生两个临时对象,首先,参数是按值传递的,所以会调用拷贝构造函

数生成一个临时对象object_copy1 ,在函数内部使用的不是使用的不是object,而是obj

ect_copy1,自然,object_copy1是一个栈对象,它在函数返回时被释放;还有这个函数是

值返回的,在函数返回时,如果我们不考虑返回值优化(NRV),那么也会产生一个临时对

象object_copy2,这个临时对象会在函数返回后一段时间内被释放。比如某个函数中有如

下代码:

Type tt ,result ; 生成两个栈对象

tt = fun(tt) ; 函数返回时,生成的是一个临时对象object_copy2

上面的第二个语句的执行情况是这样的,首先函数fun返回时生成一个临时对象objec

t_copy2 ,然后再调用赋值运算符执行

tt = object_copy2 ; 调用赋值运算符

编译器在我们毫无知觉的情况下,为我们生成了这么多临时对象,而生成这些临时对

象的时间和空间的开销可能是很大的,所以,对于“大”对象最好用const引用传递代替按

值进行函数参数传递了。

b 堆 又叫自由存储区,它是在程序执行的过程中动态分配的,其最大的特性就是动

态性。在C++中,所有堆对象的创建和销毁都要由程序员负责,如果处理不好,就会发生内

存问题。如分配了内存而没有释放则造成内存泄漏;如果已释放了对象,却没有将相应的

指针置为NULL,则可能会造成“悬挂指针”或“野指针”,再度使用此指针时,就会出现

非法访问,严重时就导致程序崩溃。

C++中一般通过new来为对象分配堆内存空间(当然,用malloc也可获得C式堆内存),

并且返回指向该堆对象的指针。

c 静态存储区 所有的静态对象、全局对象都于静态存储区分配。关于全局对象,是

在main()函数执行前就分配好了的。其实,在main()函数中的显示代码执行之前,会调用

一个由编译器生成的_main()函数,而_main()函数会进行所有全局对象的的构造及初始化

工作。而在main()函数结束之前,会调用由编译器生成的exit函数,来释放所有的全局对

象。比如下面的代码:

void main(void)

{

… … 显式代码

}

实际上,被转化成这样:

void main(void)

{

_main(); 隐式代码,由编译器产生,用以构造所有全局对象

… … 显式代码

… …

exit() ; 隐式代码,由编译器产生,用以释放所有全局对象

}

假设我们要在main()函数执行之前做某些准备工作,那么我们可以将这些准备工作写到一

个自定义的全局对象的构造函数中,这样,在main()函数的显式代码执行之前,这个全局

对象的构造函数会被调用,执行预期的动作,这样就达到了我们的目的。刚才讲的是静态

存储区中的全局对象,那么,也有对应的局部静态对象,局部静态对象通常也是在函数中

定义的,就像栈对象一样,只不过,其前面多了个static关键字。局部静态对象的生命期

是从其所在函数第一次被调用,更确切地说,是当第一次执行到该静态对象的声明代码时

,产生该静态局部对象,直到整个程序结束时,才销毁该对象。

还有一种静态对象,那就是它作为class的静态成员。考虑这种情况时,就牵涉了一些较复

杂的问题。

第一个问题是class的静态成员对象的生命期,class的静态成员对象随着第一个class ob

ject的产生而产生,在整个程序结束时消亡。也就是有这样的情况存在,在程序中我们定

义了一个class,该类中有一个静态对象作为成员,但是在程序执行过程中,如果我们没有

创建任何一个该class object,那么也就不会产生该class所包含的那个静态对象。还有,

如果创建了多个class object,那么所有这些object都共享那个静态对象成员。

第二个问题是,当出现下列情况时:

class Base

{

public

static Type s_object ;

}

class Derived1 public Base   公共继承

{

… … other data

}

class Derived2 public Base   公共继承

{

… … other data

}

Base example ;

Derivde1 example1 ;

Derivde2 example2 ;

example.s_object = …… ;

example1.s_object = …… ;

example2.s_object = …… ;

请注意上面标为黑体的三条语句,它们所访问的s_object是同一个对象吗?答案是肯

定的, 我们知道,当一个类比如Derived1,从另一个类比如Base继承时,那么,可以看作

一个Derived1对象中含有一个Base型的对象,这就是一个subobject。

当我们将一个Derived1型的对象传给一个接受非引用Base型参数的函数时会发生切割

,那么是怎么切割的呢?相信现在你已经知道了,那就是仅仅取出了Derived1型的对象中

的subobject,而忽略了所有Derived1自定义的其它数据成员,然后将这个subobject传递

给函数(实际上,函数中使用的是这个subobject的拷贝)。

所有继承Base类的派生类的对象都含有一个Base型的subobject(这是能用Base型指针

指向一个Derived1对象的关键所在,自然也是多态的关键了),而所有的subobject和所有

Base型的对象都共用同一个s_object对象,从Base类派生的整个继承体系中的类的实例都

会共用同一个s_object对象了。

二.三种内存对象的比较

栈对象的优势是在适当的时候自动生成,又在适当的时候自动销毁,不需要程序员操

心;而且栈对象的创建速度一般较堆对象快,因为分配堆对象时,会调用operator new操

作,operator new会采用某种内存空间搜索算法,而该搜索过程可能是很费时间的,产生

栈对象则没有这么麻烦,它仅仅需要移动栈顶指针就可以了。但是要注意的是,通常栈空

间容量比较小,一般是1MB~2MB,所以体积比较大的对象不适合在栈中分配。特别要注意

递归函数中最好不要使用栈对象,因为随着递归调用深度的增加,所需的栈空间也会线性

增加,当所需栈空间不够时,便会导致栈溢出,这样就会产生运行时错误。

堆对象,其产生时刻和销毁时刻都要程序员精确定义,也就是说,程序员对堆对象的

生命具有完全的控制权。我们常常需要这样的对象,比如,我们需要创建一个对象,能够

被多个函数所访问,但是又不想使其成为全局的,那么这个时候创建一个堆对象无疑是良

好的选择,然后在各个函数之间传递这个堆对象的指针,便可以实现对该对象的共享。另

外,相比于栈空间,堆的容量要大得多。实际上,当物理内存不够时,如果这时还需要生

成新的堆对象,通常不会产生运行时错误,而是系统会使用虚拟内存来扩展实际的物理内

存。

    接下来看看static对象。

首先是全局对象。全局对象为类间通信和函数间通信提供了一种最简单的方式,虽然

这种方式并不优雅。一般而言,在完全的面向对象语言中,是不存在全局对象的,比如C#

,因为全局对象意味着不安全和高耦合,在程序中过多地使用全局对象将大大降低程序的

健壮性、稳定性、可维护性和可复用性。C++也完全可以剔除全局对象,但是最终没有,我

想原因之一是为了兼容C。

其次是类的静态成员,上面已经提到,基类及其派生类的所有对象都共享这个静态成

员对象,所以当需要在这些class之间或这些class objects之间进行数据共享或通信时,

这样的静态成员无疑是很好的选择。

接着是静态局部对象,主要可用于保存该对象所在函数被屡次调用期间的中间状态,

其中一个最显著的例子就是递归函数,我们都知道递归函数是自己调用自己的函数,如果

在递归函数中定义一个nonstatic局部对象,那么当递归次数相当大时,所产生的开销也是

巨大的。这是因为nonstatic局部对象是栈对象,每递归调用一次,就会产生一个这样的对

象,每返回一次,就会释放这个对象,而且,这样的对象只局限于当前调用层,对于更深

入的嵌套层和更浅露的外层,都是不可见的。每个层都有自己的局部对象和参数。

在递归函数设计中,可以使用static对象替代nonstatic局部对象(即栈对象),这不

仅可以减少每次递归调用和返回时产生和释放nonstatic对象的开销,而且static对象还可

以保存递归调用的中间状态,并且可为各个调用层所访问。

三.使用栈对象的意外收获

前面已经介绍到,栈对象是在适当的时候创建,然后在适当的时候自动释放的,也就

是栈对象有自动管理功能。那么栈对象会在什么会自动释放了?第一,在其生命期结束的

时候;第二,在其所在的函数发生异常的时候。你也许说,这些都很正常啊,没什么大不

了的。是的,没什么大不了的。但是只要我们再深入一点点,也许就有意外的收获了。

栈对象,自动释放时,会调用它自己的析构函数。如果我们在栈对象中封装资源,而

且在栈对象的析构函数中执行释放资源的动作,那么就会使资源泄漏的概率大大降低,因

为栈对象可以自动的释放资源,即使在所在函数发生异常的时候。实际的过程是这样的:

函数抛出异常时,会发生所谓的stack_unwinding(堆栈回滚),即堆栈会展开,由于是栈

对象,自然存在于栈中,所以在堆栈回滚的过程中,栈对象的析构函数会被执行,从而释

放其所封装的资源。除非,除非在析构函数执行的过程中再次抛出异常――而这种可能性

是很小的,所以用栈对象封装资源是比较安全的。基于此认识,我们就可以创建一个自己

的句柄或代理来封装资源了。智能指针(auto_ptr)中就使用了这种技术。在有这种需要

的时候,我们就希望我们的资源封装类只能在栈中创建,也就是要限制在堆中创建该资源

封装类的实例。

四.禁止产生堆对象



产生堆对象的方法是使用new操作,如果我们禁止使用new不就行了么。再进一步,ne

w操作执行时会调用operator new,而operator new是可以重载的。方法有了,就是使new

operator 为private,为了对称,最好将operator delete也重载为private。现在,你也

许又有疑问了,难道创建栈对象不需要调用new吗?是的,不需要,因为创建栈对象不需要

搜索内存,而是直接调整堆栈指针,将对象压栈,而operator new的主要任务是搜索合适

的堆内存,为堆对象分配空间,这在上面已经提到过了。好,让我们看看下面的示例代码



#include stdlib.h 需要用到C式内存分配函数

class Resource ; 代表需要被封装的资源类

class NoHashObject

{

private

Resource ptr ;指向被封装的资源

其它数据成员

void operator new(size_t size) 非严格实现,仅作示意之用

{

return malloc(size) ;

}

void operator delete(void pp) 非严格实现,仅作示意之用

{

free(pp) ;

}

public

NoHashObject()

{

此处可以获得需要封装的资源,并让ptr指针指向该资源

ptr = new Resource() ;

}

~NoHashObject()

{

delete ptr ; 释放封装的资源

}

};

NoHashObject现在就是一个禁止堆对象的类了,如果你写下如下代码:

NoHashObject fp = new NoHashObject() ; 编译期错误!

delete fp ;

上面代码会产生编译期错误。好了,现在你已经知道了如何设计一个禁止堆对象的类

了,你也许和我一样有这样的疑问,难道在类NoHashObject的定义不能改变的情况下,就

一定不能产生该类型的堆对象了吗?不,还是有办法的,我称之为“暴力破解法”。C++是

如此地强大,强大到你可以用它做你想做的任何事情。这里主要用到的是技巧是指针类型

的强制转换。

void main(void)

{

char temp = new char[sizeof(NoHashObject)] ;

强制类型转换,现在ptr是一个指向NoHashObject对象的指针

NoHashObject obj_ptr = (NoHashObject)temp ;

temp = NULL ; 防止通过temp指针修改NoHashObject对象

再一次强制类型转换,让rp指针指向堆中NoHashObject对象的ptr成员

Resource rp = (Resource)obj_ptr ;

初始化obj_ptr指向的NoHashObject对象的ptr成员

rp = new Resource() ;

现在可以通过使用obj_ptr指针使用堆中的NoHashObject对象成员了

delete rp ;释放资源

temp = (char)obj_ptr ;

obj_ptr = NULL ;防止悬挂指针产生

delete [] temp ;释放NoHashObject对象所占的堆空间。

}

上面的实现是麻烦的,而且这种实现方式几乎不会在实践中使用,但是我还是写出来

路,因为理解它,对于我们理解C++内存对象是有好处的。对于上面的这么多强制类型转换

,其最根本的是什么了?我们可以这样理解:

某块内存中的数据是不变的,而类型就是我们戴上的眼镜,当我们戴上一种眼镜后,

我们就会用对应的类型来解释内存中的数据,这样不同的解释就得到了不同的信息。

所谓强制类型转换实际上就是换上另一副眼镜后再来看同样的那块内存数据。

另外要提醒的是,不同的编译器对对象的成员数据的布局安排可能是不一样的,比如

,大多数编译器将NoHashObject的ptr指针成员安排在对象空间的头4个字节,这样才会保

证下面这条语句的转换动作像我们预期的那样执行:

Resource rp = (Resource)obj_ptr ;

但是,并不一定所有的编译器都是如此。

既然我们可以禁止产生某种类型的堆对象,那么可以设计一个类,使之不能产生栈对

象吗?当然可以。

五.禁止产生栈对象

前面已经提到了,创建栈对象时会移动栈顶指针以“挪出”适当大小的空间,然后在

这个空间上直接调用对应的构造函数以形成一个栈对象,而当函数返回时,会调用其析构

函数释放这个对象,然后再调整栈顶指针收回那块栈内存。在这个过程中是不需要operat

or newdelete操作的,所以将operator newdelete设置为private不能达到目的。当然从上

面的叙述中,你也许已经想到了:将构造函数或析构函数设为私有的,这样系统就不能调

用构造析构函数了,当然就不能在栈中生成对象了。

这样的确可以,而且我也打算采用这种方案。但是在此之前,有一点需要考虑清楚,那

就是,如果我们将构造函数设置为私有,那么我们也就不能用new来直接产生堆对象了,因

为new在为对象分配空间后也会调用它的构造函数啊。所以,我打算只将析构函数设置为p

rivate。再进一步,将析构函数设为private除了会限制栈对象生成外,还有其它影响吗?

是的,这还会限制继承。

如果一个类不打算作为基类,通常采用的方案就是将其析构函数声明为private。

为了限制栈对象,却不限制继承,我们可以将析构函数声明为protected,这样就两全

其美了。如下代码所示:

class NoStackObject

{

protected

~NoStackObject() { }

public

void destroy()

{

delete this ;调用保护析构函数

}

};

接着,可以像这样使用NoStackObject类:

NoStackObject hash_ptr = new NoStackObject() ;

对hash_ptr指向的对象进行操作

hash_ptr-destroy() ;

是不是觉得有点怪怪的,我们用new创建一个对象,却不是用delete去删除它,而是要

用destroy方法。很显然,用户是不习惯这种怪异的使用方式的。所以,我决定将构造函数

也设为private或protected。这又回到了上面曾试图避免的问题,即不用new,那么该用什

么方式来生成一个对象了?我们可以用间接的办法完成,即让这个类提供一个static成员

函数专门用于产生该类型的堆对象。(设计模式中的singleton模式就可以用这种方式实现

。)让我们来看看:

class NoStackObject

{

protected

NoStackObject() { }

~NoStackObject() { }

public

static NoStackObject creatInstance()

{

return new NoStackObject() ;调用保护的构造函数

}

void destroy()

{

delete this ;调用保护的析构函数

}

};

现在可以这样使用NoStackObject类了:

NoStackObject hash_ptr = NoStackObjectcreatInstance() ;

对hash_ptr指向的对象进行操作

hash_ptr-destroy() ;

hash_ptr = NULL ; 防止使用悬挂指针

18456.html

c