_alloca 函数的实现
C 语言里有一个 alloca 函数,可以在堆栈上分配一块内存,当前函数退出时,由于系统堆栈指针的调整,这块内存会被自动回收。
alloca 的函数原型是
void * alloca(size_t size);
今天,在各种编程文档中已经不太提倡使用了。因为它有许多不安全因素。这里暂且不讨论。
另外,在 CRT 库里,通常还会提供一个 _alloca
函数,供编译器内部生成代码使用。比如在 C99 标准中,允许程序员在堆栈上开启变长数组,gcc 其实就是通过 _alloca
分配的内存来实现这个特性的。
另外,当你分配为局部变量数组申请空间过大时,gcc 也会调用 _alloca
。(大概是因为 crt 在实现 alloca 时,附带增加了一定的检测功能,测试堆栈溢出)
这个周末,我手工写了一个 _alloca
,试着替换 CRT 的实现(莫追究原因 :) )。一开始老不得要领,总是不能正常工作。
gcc 的这个 _alloca
是个内部函数,其调用协议不同于 alloca 。它的尺寸参数并不通过堆栈传递,而是直接通过寄存器。在 X86 上,就是 eax 。
返回值当然是通过 eax 送出,同时一并修改了堆栈寄存器 esp 。
经过多次程序崩溃,并用 gdb 对汇编代码逐行分析,还看出了另外一点门道。
调用 _alloca
这个函数前,调用者并不需要对其它寄存器里的数据安全负责。就是说,_alloca
需要负责除 eax esp 之外的寄存器内的数据安全,不得破坏。(或许没有这么严格,我试着用了一个 ecx ,并没有出错。但是破坏掉 edx 却是一定会引起程序崩溃的)
如果打开 gcc 的优化开关(我使用的 -O2 ,gcc 版本 3.4.5),编译器有时候会预测 _alloca
的行为,并以此来决定堆栈上局部变量的分布(往往出现在代码中以常量申请固定尺寸的大数组的情况下)。_alloca
的行为被认为是在堆栈上准确分配经过 4 字节对齐后的 eax 内值大小的空间。不仅不能少分配,连多分配也是不允许的(否则会导致编译器生成的代码出错)。
最后给出云风的 _alloca
的实现。
.globl __alloca; __alloca: subl $1,%eax andl $0xfffffffc,%eax /* align to dword */ subl %eax,%esp pushl (%esp,%eax) /* return addr */ movl %esp,%eax addl $4,%eax ret
ps. 这个帖子放在这里,日后肯定会有同学偷懒搜代码搜过来的,嘿嘿。程序随便用,但出了问题别找我。我不帮人做作业。
Comments
Posted by: temper | (8) September 22, 2013 12:05 AM
Posted by: K+ | (7) April 20, 2009 09:18 PM
Posted by: Zhe | (6) September 1, 2008 01:57 PM
Posted by: Cloud | (5) September 1, 2008 01:30 AM
Posted by: yue169 | (4) September 1, 2008 12:54 AM
Posted by: 夏天 | (3) August 27, 2008 05:15 AM
Posted by: 2ndboy | (2) August 25, 2008 11:32 AM
Posted by: Reynard | (1) August 24, 2008 07:46 PM