« October 2019 | Main | December 2019 »

November 17, 2019

易于修改原则

这个月来,我已经在从事《程序员修炼之道》第二版的翻译。到现在已经超过十万字,几乎是全书的一半了。

很难很累。翻译和阅读是两码事,就算自己理解了,想说清楚也是很难的。何况有些句子理解起来摸棱两可,想理解透彻也不是那么容易的事。毕竟是别人的思想,凡思想都非真理,没有太多对错可言,翻译者只求能准确表达。

不过越是深入,越是觉得自己在做一件伟大的事。这本书一如二十年前的那一版一样,字字珠玑。能给无数程序员引路。有些道理过去讲得不甚透彻的,经过数十年的历练,作者看得更通透了。

比如,有一条过去没有提及的原则,在这一版中放在了重中之重的位置。那就是:ETC 原则,Easier To Change ,易于修改。

我当然明白,易于修改非常重要。但从未想过,它可以是一切原则的基石。

在上一版中,作者言必提 DRY 原则,Don't Repeat Yourself ,不要重复。我觉得说得还不够好,我自己更喜欢 Unix 编程艺术中的提法 SPOT :Single Point Of Truth ,唯一真理。但这次,DRY 被放在了一个次要的位置,和本书提出的其他原则一起,围绕着一个更基本的原则谈起。为什么不能重复?为什么真理只应写在一个地方?

因为,我们所作的一切,都是为了更容易修改。

当真理只存在一个地方,那么在需要修改它的时候,就只需要改动一处,更容易修改了。

为什么需要解耦模块。因为耦合在一起的模块很难修改。在修改时,要么你要花时间搞清楚关联之处都在哪些地方;要么你不去搞清楚,只改一处,结果出了问题,再花时间弄明白问题出在哪里,有什么牵连之处忘记了。解耦之后,可以放心的只修改一处就够了,更容易修改。

为什么我们要给函数名,变量名取个好名字。取名为什么是很重要的事?因为好的名字方便阅读,而修改的前提就是阅读。好的名字让修改更容易。

……

说到取名,在翻译每章时,我会在作者篇头引用的名言翻译上颇费一番功夫。仔细查找出处,推敲为什么本章要引用这句话。许多句子我过去从没了解过,搜索下去会被原著所吸引。

前天翻到作者引用《地海传奇》中的一句话,"To light a candle is to cast a shadow" ,我引用了蔡美玲的译文 “点亮一盏烛光,便投出一道阴影。” ,编辑说 点亮 ... 烛光 有点语法问题,建议改成 烛火。我在推敲之余,对书产生了兴趣,在 kindle 上买了一套。结果读了两页就停不下来。周末一口气读完了前三本。

名字为什么重要?《地海传奇》能给我们答案 :)

November 07, 2019

skynet 网络层的一点小优化

在 2017 年的时候,我对 skynet 网络层的写操作做了一些优化 ,优化点是:如果 socket 并不繁忙,就不必把数据转达到网络线程写,而是直接写入 socket 。这可以减轻单线程网络层的负担,对于写操作频繁的场景会有极大的提升。

最近两天我想起来,如果大部分场合都可以通过直接写入 socket 而不必转发到网络线程发送数据的话,其实我们可以进一步的减少一次内存拷贝。

原来的设计是这样的:

所有待发送的数据由发送者打包成一个数据对象,转发给网络线程。网络线程真正把数据发送走了以后,再将这个对象销毁掉。

这个数据对象一开始只支持 malloc 分配出来的内存块。所以,api 的约定就是一个 void * 指针和一个 size_t 的长度。要求使用者遵循指针必须用 malloc 分配的约定。

后来,有不少同学希望在同一个数据块发送给多个 socket 的场景下,不用将数据复制成多份。通常的做法是给数据对象加一个引用计数。为了满足这类需求,我扩展了网络数据对象,允许支持自定义格式。方法是调用 socket_server_userobject 这个 api ,把 userobject 的接口传给网络层。

为了兼容过去的接口(保持一致的 abi ),我当时用了一个取巧的方法扩展接口。因为用户自定义对象是不需要长度的(用户对象接口中可以取到长度),而原始内存对象的长度必然大于等于 0 。所以就约定在发送接口中,长度传 -1 表示是用户对象。

这不是一个好的接口扩展的方法,这次想做进一步的扩展时,我想重新规范一下。所以就加了 socket_buffer.h 这样一个头文件,里面定义了新的网络发送的数据包的结构。目前是这样的:

#define SOCKET_BUFFER_MEMORY 0
#define SOCKET_BUFFER_OBJECT 1
#define SOCKET_BUFFER_RAWPOINTER 2

struct socket_sendbuffer {
    int id;
    int type;
    const void *buffer;
    size_t sz;
};

现在用 type 字段明确定义了数据类型。SOCKET_BUFFER_MEMORY 对应之前的 malloc 内存块;SOCKET_BUFFER_OBJECT 对应之前的用户定义数据对象;新增了 SOCKET_BUFFER_RAWPOINTER 用于 raw 指针。

raw 指针类型是告诉 skynet ,这个指针指向的数据可以直接使用,但是不能保存下来。如果需要缓存到之后再使用(通常是转发给网络层),需要自行拷贝。

有了新的数据类型,对 lua 层的 skynet.socket.send 这个 api 来说,如果发送的是一个 lua string ,那么就不必像之前那样,必须用 malloc 分配一块内存,把内容复制进去了。而只需要把 lua string 的内存地址传给 skynet ,如果 skynet 发送可以直接发送走,那么就不用额外拷贝。

新的 patch 在 sendbuffer 分支上,有兴趣的同学可以 review 一下这个 patch ,过几天我再合并到主干。

因为还是要兼容之前的接口,所以这次我新增了一组 api 取代旧 api 。用 skynet_socket_sendbuffer 代替之前的 skynet_socket_send ,等等。就有的 api 名字全部保留,改为用宏实现:

static inline void sendbuffer_init_(struct socket_sendbuffer *buf, int id, const void *buffer, int sz) {
    buf->id = id;
    buf->buffer = buffer;
    if (sz < 0) {
        buf->type = SOCKET_BUFFER_OBJECT;
    } else {
        buf->type = SOCKET_BUFFER_MEMORY;
    }
    buf->sz = (size_t)sz;
}

static inline int skynet_socket_send(struct skynet_context *ctx, int id, void *buffer, int sz) {
    struct socket_sendbuffer tmp;
    sendbuffer_init_(&tmp, id, buffer, sz);
    return skynet_socket_sendbuffer(ctx, &tmp);
}

多说一点 skynet 网络层的设计想法。

我认为,skynet 网络层的设计目的是,把操作系统层面的 socket 数据从系统内核复制到用户空间,然后再把用户空间的数据地址交给各个不同的服务使用,同时也把用户空间需要发送的数据转移到系统内核中。

设计之初,我认为 skynet 会用于一个瓶颈不在网络传输层的场合。也就是说,网络 IO 收发的数据,传输所用的 cpu 开销是原小于处理这些数据的 cpu 开销的。所以,使用一个单独的唯一线程完成所有网络连接的收发,我认为是绰绰有余的。假定你只有一块网卡,那么单核的 cpu 处理能力,它所能达到的数据吞吐量,我认为是超过网卡的数据吞吐量的。

后来实际发现还有优化的余地,所以我把读写分离,大部分的写操作可以从网络线程移出。

下一步是否需要把读操作也移出?我目前的想法是还没有必要。或许有一天会增加多个线程读数据,把读操作从网络线程中分离出来,让网络线程只做 poll 操作。但我还是想把读操作保持在模块内部,也就是不把读操作的职责分离到外面去。

不过,lua 对 socket 的封装层我认为还有很大的改进空间。或许我们应该把网络层从内核里搬出来到用户空间中的数据,再次转移到 lua vm 内部的这个过程优化一下。

socket 的封装库可以实现一个线程安全的 buffer 统一管理所有读出的数据(而不是现在这样,每个 vm 的 socket 库都独立分开的拼装网络输入)。lua 的接口上,把输入数据生成 lua 的 string 这个过程,改成分析数据、消费数据两个阶段。分析数据可以直接针对 C 层的 buffer 直接进行,而不一定要复制成 lua string 。而分析使用完数据后,再调用消费接口,通知下层说,已经用掉了这些数据。

如果不调用消费接口,就可以在分析完数据后,若发现该数据不该自己处理,就直接转移交别的服务。因为数据并没有消费,其它服务就能直接重新从 C 层分析使用。