« Skynet 的一次大更新 | 返回首页 | 字体勾边渲染的简单方法 »

去掉 full userdata 的 GC 元方法

根据 Lua 文档中的说法,lightuserdata 比 fulluserdata 要廉价一些。那么,其中的区别在哪里呢?

空间开销上,fulluserdata 是一个 GC 对象,所以比 lightuserdata 要多消耗一点内存,这点内存往往对程序不造成太大的影响。

时间开销上,fulluserdata 在访问它时和 lightuserdata 并无太大区别,它们都只能通过元方法才能在 Lua 中使用。所有 lightuserdata 共用一个元表,不如 fulluserdata 灵活,在元表访问效率上却是几乎相同的。对程序性能有影响的部分在于它们对 GC 环节的开销不同。

fulluserdata 本身是一个 GC 对象,所以在扫描的时候要复杂一些。它可能有附带的 uservalue 需要扫描,但不设置 uservalue 几乎就没有额外的扫描开销了。当 fulluserdata 有 gc 元方法后,就给 GC 流程增加了额外的负担。GC 模块需要额外记录一个链表来串接起所有有 gc 元方法的对象,推迟到 gc 的最后环节依次调用。

对于对延迟相当敏感的游戏程序来说,最容易造成运行过程中瞬间延迟增加,却又很难控制的部分就是 GC 了。所以我们在开发中经常需要关注怎样合理的使用 Lua 避免 GC 的负担过大。

前些年我在 blog 上给出过一个用 lightuserdata 模拟 userdata 的 GC 过程的方法

如果直接使用 userdata ,那么就应该尽量直接用 lua_newuserdata 分配出整个 C 结构,且避免结构里面有额外的指针引用的内存。C 对象的构造接口用 int object_init(struct object *) 就好过 struct object * object_create() ,因为后者一般需要 lua_newuserdata 分配一个指针,再把 struct object * 放进去。这就使得你必须附加一个 gc 元方法才能保证没有内存泄露。

但有时候,有些复杂的结构不可能把整个对象放在一块连续内存中,那么还能有什么技巧呢?

我在改进 skynet 的 lua socket 库的时候,碰到了这个问题。

需求是这样的:skynet 提供了一个用 C 编写的异步 socket 库,所有 socket 请求都是通过一个消息队列分发回来的。我希望封装成 Lua 版的 api 时可以去掉这些。我需要给每个 socket 对象绑定一个数据队列,一旦有 socket 数据发进来就串在队列上,然后再逐个解析。

https://github.com/cloudwu/skynet/blob/master/lualib-src/lua-socket.c 里我定义了这样的数据结构:

struct buffer_node {
    char * msg;
    int sz;
    struct buffer_node *next;
};

struct socket_buffer {
    int size;
    int offset;
    struct buffer_node *head;
    struct buffer_node *tail;
};

需要封装的是 struct socket_buffer 结构,它里面引用了一个链表 struct buffer_node 。每组 socket 数据会以 struct buffer_node 的形式从底层产生,被挂接到 struct socket_buffer 的链表中。在运行过程中,随着程序运行,处理过的 socket 数据又会被释放。

我干脆一次申请了大块内存保存多个 struct buffer_node ,暂时用不到的内存,把它们串成一个 freelist 放在 lua 的一张表中,不到 lua vm 关闭前不释放。而所有需要传入 struct socket_buffer 的地方,都再传一个存放有 freelist 的 lua table 负责管理新创建以及需要销毁的 struct buffer_node

如此,封装 struct buffer_nodestruct socket_buffer 成为 lua 的 userdata 就都不需要 gc 元方法了。

当然,这个方法仅仅只是保证最终没有内存泄露,socket_buffer 依旧需要一个显式的关闭操作。这个道理跟 socket fd 需要显式关闭而不能等 GC 再关闭一样。


这个技巧还可以用于树结构的管理。就不具体展开了。

总结:把碎片结构放到一个 userdata 构成的 freelist 池中,然后从 userdata 里引用池内的结构。这样就可以避免给每个 userdata 指定 GC 方法来释放其中的链表或树节点。

把所有内存都交给 lua 去管理(这里提到的内存分配都是利用的 lua_newuserdata ,它是被 lua 管理起来的)对 GC 也更加友好。Lua 可以更清楚的了解你的程序用掉了多少内存以合理调配 GC 的进度。

Comments

static int
lnewpool(lua_State *L, int sz) {

};


多了个分号!

Post a comment

非这个主题相关的留言请到:留言本