« 基于引用计数的对象生命期管理 | 返回首页 | 资源包的设计 »

嵌入式 lua 中的线程库

无论是客户端还是服务器,把 lua 作为嵌入语言使用的时候,都在某种程度上希望把 lua 脚本做多线程使用。也就是你的业务逻辑很可能有多条业务线索,而你希望把它们跑在同一个 lua vm 里。

lua 的 coroutine 可以很好的模拟出线程。事实上,lua 自己也把 coroutine 对象叫做 thread 类型。

最近我在反思 skynet 的 lua 封装时,想到我们的主线程是不可以调用阻塞 api 的限制。即在主干代码中,不可以直接 yield 。我认为可以换一种更好(而且可能更简洁)的封装形式来绕过这个限制,且能简化许多其它部分的代码。

下面介绍一下我的新想法,它不仅可以用于 skynet 也应该能推广到一切 lua 的嵌入式应用(由你自己来编写 host 代码的应用,比如客户端应用):

我们可以在第一个主模块加载时,在 skynet 中也就是 require "skynet" 这里,启动一个调度器的 coroutine 。

这个 coroutine 只用来管理一个数组,数组里全部是业务逻辑的线程。

这个调度器所属的 coroutine 对应的 lua_State 指针,应该记录在 lua vm 的注册表中,保证只到整个 vm 关闭前都活着,那么,接下来我们就可以放心的把它保存在 host 程序中了。

这样,在 host 程序中,除了原有的代表 vm 以及主线程的 L 之外,我们还有一个代表调度器 coroutine 的 cL 。

启动主逻辑的地方,在创建出 vm 后,通常是加载一个主程序文本,然后使用 lua_resume 运行主线程。如果主线程正常运行结束,则之后不再利用主线程 L 做任何事情;但若主线程被挂起,则把它加到调度线程管理的线程列表组里,之后当作普通业务线程去调度。

我们可以同时提供 lua 及 C API 来向这个数组添加新线程(coroutine) ,调度器的职责是永远在空闲的时候尝试 resume 新添加的线程,以及在外部 IO 消息抵达时去唤醒挂起的线程。这个调度过程中,原来的主线程和其它被创建出来的线程并无区别。

而调度器本身的算法并不需要太复杂,也完全没有必要用 host API 去实现,lua 来编写就完全胜任了。


有了这样的多线程机制后,我们可能还需要对 lua 原有的 coroutine 库做一点改造。改造后可以用业务层的 coroutine 和利用 lua coroutine 实现的线程库可以协同工作。这个之前我已经写过一篇 blog 了

Comments

我现在遇到了个情况,大概是这样的 c#这边有很多个窗口,每个窗口都有一个线程池,来处理队列信息,同时还有一个线程来执行lua脚本。现在的问题是一两个脚本执行的时候没有问题,当超过8个窗口启动,就会导致所有窗口的队列堵塞,后来发现,这个跟lua的代码量有关,如果lua代码少,则启动好多窗口才触发,如果lua代码特别多,如8000行,3-4个窗口就会导致队列堵塞,主要是全部窗口的队列堵塞。 能帮我分析下原因么?是lua的虚拟机和lua的队列有冲突么?
一直紧跟云大的脚步哈,很佩服您。您说的和我以前的想法一样,也是我一直想简化掉的设计方案,去年在我的node-lua框架的设计中已经实现了,入口文件即运行在coroutine当中。不过我所有异步和同步的coroutine管理都是c层做的,顶层coroutine不能调用原生的coroutine的yield和resume接口。
看了您的博文总结的非常好,您的博客非常不错。我也推荐一个程序员必备的搜索博客问答的网站 http://www.itdaan.com 。
skynet 从 C 到 lua 的入口只有两个地方,init 和 callback 。 init 不必是主程序,也可以是 `skynet.start(main_chunk)` 。这样主程序里就可以调用阻塞 API 了。 callback 里面做的就是调度的事,这个地方完全是由 skynet 控制的,不需要调用阻塞 API ,也没必要弄成 coroutine 。 其实也可以把 `require` 也截取下,这样就可以在 lua 库里面调用阻塞 API 了。
游戏是以c++为主的吧,为什么不看看ChaiScript

Post a comment

非这个主题相关的留言请到:留言本