« 让 lua 编译时计算 | 返回首页 | google chrome 的确很 cool »

_alloca 函数的实现

C 语言里有一个 alloca 函数,可以在堆栈上分配一块内存,当前函数退出时,由于系统堆栈指针的调整,这块内存会被自动回收。

alloca 的函数原型是

void *
alloca(size_t size);

今天,在各种编程文档中已经不太提倡使用了。因为它有许多不安全因素。这里暂且不讨论。

另外,在 CRT 库里,通常还会提供一个 _alloca 函数,供编译器内部生成代码使用。比如在 C99 标准中,允许程序员在堆栈上开启变长数组,gcc 其实就是通过 _alloca 分配的内存来实现这个特性的。

另外,当你分配为局部变量数组申请空间过大时,gcc 也会调用 _alloca 。(大概是因为 crt 在实现 alloca 时,附带增加了一定的检测功能,测试堆栈溢出)

这个周末,我手工写了一个 _alloca ,试着替换 CRT 的实现(莫追究原因 :) )。一开始老不得要领,总是不能正常工作。

gcc 的这个 _alloca 是个内部函数,其调用协议不同于 alloca 。它的尺寸参数并不通过堆栈传递,而是直接通过寄存器。在 X86 上,就是 eax 。

返回值当然是通过 eax 送出,同时一并修改了堆栈寄存器 esp 。

经过多次程序崩溃,并用 gdb 对汇编代码逐行分析,还看出了另外一点门道。

调用 _alloca 这个函数前,调用者并不需要对其它寄存器里的数据安全负责。就是说,_alloca 需要负责除 eax esp 之外的寄存器内的数据安全,不得破坏。(或许没有这么严格,我试着用了一个 ecx ,并没有出错。但是破坏掉 edx 却是一定会引起程序崩溃的)

如果打开 gcc 的优化开关(我使用的 -O2 ,gcc 版本 3.4.5),编译器有时候会预测 _alloca 的行为,并以此来决定堆栈上局部变量的分布(往往出现在代码中以常量申请固定尺寸的大数组的情况下)。_alloca 的行为被认为是在堆栈上准确分配经过 4 字节对齐后的 eax 内值大小的空间。不仅不能少分配,连多分配也是不允许的(否则会导致编译器生成的代码出错)。

最后给出云风的 _alloca 的实现。

.globl __alloca; 
__alloca:
    subl    $1,%eax
    andl    $0xfffffffc,%eax    /* align to dword */
    subl    %eax,%esp
    pushl   (%esp,%eax)     /* return addr */
    movl    %esp,%eax
    addl    $4,%eax
    ret

ps. 这个帖子放在这里,日后肯定会有同学偷懒搜代码搜过来的,嘿嘿。程序随便用,但出了问题别找我。我不帮人做作业。

Comments

我也搜到了这里...
果然,我搜到这里来了……
很好奇云风这是打算做什么呢? 说起来,在apple OS X/darwin上就不行(gcc 4.0/4.2),因为16字节对齐 玩ABI必自焚……
没试过。但是似乎没有道理出问题。
此函数用在gcc4.x.x上应该也没问题吧?
有兴趣研究函数运行栈了呀,Lua使用一个栈复制C函数运行栈,Lua函数本身也是这种运行栈,使用四组函数完成互相调用lua->栈,栈->lua,C->栈,栈->C。
alloca() 分配超大内存时会出问题(AV)。
什么时候我有这水平啊。。

Post a comment

非这个主题相关的留言请到:留言本