云风的 BLOG: 动态字模的管理

在上一篇 blog 中，我谈到了 UI 模块。而 UI 模块中绕不开的一个问题就是怎么实现文字渲染。

和西方文字不同，汉字的数量多达数万。想把所有文字的字模一次性烘培到贴图上未尝不可，但略显浪费。如果游戏只是用有限几种字体倒也不失一种简单明了的方法。但如果使用字体丰富，而多数字体只使用几个汉字，那么就不太妥当了。

我在设计 ejoy2d 的时候实现过一版动态字模的管理。但我觉得略显简陋。最近重新做了一版。

首先，我决定使用 SDF 来渲染字体，所以不必在贴图中管理不同大小的字模了。其次，我觉得汉字的宽度其实一致是一致的，我们不必再用复杂的装箱算法去节省贴图空间，改用等宽登高的固定大小矩形区域切分贴图，更容易做到灵活管理。

最终设计的管理器的 C API 大致是这样的：

void font_manager_init(struct font_manager *);
int font_manager_addfont(struct font_manager *, const void *ttfbuffer);
int font_manager_rebindfont(struct font_manager *, int fontid, const void *ttfbuffer);
void font_manager_fontheight(struct font_manager *F, int fontid, int size, int *ascent, int *descent, int *lineGap);
int font_manager_touch(struct font_manager *, int font, int codepoint, struct font_glyph *glyph);
const char * font_manager_update(struct font_manager *, int font, int codepoint, struct font_glyph *glyph, unsigned char *buffer);
void font_manager_flush(struct font_manager *);
void font_manager_scale(struct font_manager *F, struct font_glyph *glyph, int size);

管理器还是不管理具体贴图和像素，只管理区域。我们可以把多个 ttf 数据加载进去（得到一个 font id），也允许卸载掉，之后再使用的使用 rebind 。

核心的管理 api 是 touch 和 update 。touch 指用户计划使用一个字模了，这里可以获取到相关的 glyph 结构。但这个字模可能在 cache 中，也可能不在（根据返回值判断）。如果在 cache 中，就可以直接利用 glyph 结构中的 uv 渲染，否则，还需要调用 update 。

而 update 则真正将字模的像素从 ttf 回填到用户给出的 buffer 中。继而用户有责任上传到贴图中。

之所以将这两个 api 分开，是因为字体管理器不负责贴图管理，也不涉及更新贴图的 api 。

另外，因为我们用 SDF 渲染字体，所以提供一个 scale 函数计算对应的缩放信息。

值得一谈的这次这个字体管理模块的实现。

我在实现的时候，设计内部数据结构的指导原则是，采用固定大小的数据结构，并在使用过程中做到零内存分配。且不依赖任何渲染层的 API 。这并不太容易做到。

来看看需求：

不同的 font 不同的 codepoint 被放进这个数据结构中，这些数据可能动态增删，但希望可以 O(1) 检索。符合这个需求的似乎只能是 hash 表。而固定内存的 hash 表，通常被实现成开散列的。

我希望 cache 中保存的数据以 LRU 形式进出，即太久不太使用的字模会被淘汰掉。当我们 touch 一个字的时候，需要放在这个 LRU 队列的最前面；队列满的时候，需要从最后删掉一个。看起来，比较朴素的思想是用一个双向链表来实现这个数据结构。

另外，我们可能不希望一个 drawcall 只画一个字，所以提供了 flush 这个 api 告诉库发生了一次 draw 。在两次 flush 之间，需要一个自增的版本号来区分。

所以最终，font_manager 这个数据结构是这样的：

struct font_slot {
    int codepoint_ttf;  // high 8 bits (ttf index)
    short offset_x;
    short offset_y;
    short advance_x;
    short advance_y;
    unsigned short w;
    unsigned short h;
};

struct priority_list {
    int version;
    short prev;
    short next;
};

struct font_manager {
    int version;
    int count;
    short list_head;
    short font_number;
    struct stbtt_fontinfo ttf[FONT_MANAGER_MAXFONT];
    struct font_slot slots[FONT_MANAGER_SLOTS];
    struct priority_list priority[FONT_MANAGER_SLOTS];
    short hash[FONT_MANAGER_HASHSLOTS];
};

struct font_glyph {
    short offset_x;
    short offset_y;
    short advance_x;
    short advance_y;
    unsigned short w;
    unsigned short h;
    unsigned short u;
    unsigned short v;
};

其中 codepoint 和 fontid 合并到一个 32bit 整数中。hash 函数采用：

static inline int
hash(int value) {
    return (value * 0xdeece66d + 0xb) % FONT_MANAGER_HASHSLOTS;
}

开散列 hash 结构，在发生冲突的时候采用固定步长 7 来选取下一个 slot 。

LRU 队列使用 short index 的双向循环链表，保证调整优先级的时候是 O(1) 的时间复杂度。

其它具体代码就不列出了。

Comments

@Cloud 感谢，现在没问题了。想了一下，用 256x256 512x512 1024x1024 2048x2048 四种大小的纹理进行缓存，填充如果不够的话进行扩展，超过最大的话再增加texture，这样是不是可以减少一点内存使用和drawcall。这样感觉texture扩大的时候产生的拷贝有可能会产生不大平缓的感觉，不过显存之间对拷应该还是很快的。另外对于2048*2048来说，1k+glyph应该都够用了，这个增长策略应该是够了。对于超出矩形格子的，参考一下skia的实现，感觉应该可以用freetype生成path缓存进行绘制。我看@gongminmin老师说的(http://www.klayge.org/docs/klayge%E4%B8%AD%E7%9A%84%E5%AD%97%E4%BD%93%E7%B3%BB%E7%BB%9F/)，感觉SDF应该没有缓存多个字号的必要，另外字体效果的实现可以做在shader里，还是很有优势的，打算做两套对比下效果。 P.S. “减少 bug 应该从简化数据结构做起。”这句话真的深有感触。

Posted by: foxerzhou | (13) August 11, 2020 05:43 PM

如文中所述，我认为在管理 glyph 的时候，没有必要将不同尺寸的 glyph 混装在贴图上。而应该留出等大的矩形槽位。这样算法要简单的多，可以随便替换掉不常用的 glyph 。这样做可行基于两点： 1. 中文都是方块字，取一个最大矩形块就够了。万一还有更大的字，直接 clip 掉超出部分也在可以接受的范围内。 2. 英文字母本身就没几个，每个 glyph 浪费一点空间也无所谓。 qq 阅读这种崩溃，就是软件 bug 。理论上最坏情况就是增加一些 drawcall 而已，谈不上崩溃。减少 bug 应该从简化数据结构做起。

Posted by: Cloud | (12) August 11, 2020 11:42 AM

我这周用Skyline Bottom-Left替换了librocket里的字体显示部分，实现了cjk字系的显示（暂时是不停的塞进去，没有缓存策略）。看了这篇文章。有些疑问。 1. 上文说的缓存是cpu还是gpu texutre？如果是gpu texutre的话，对于已经被淘汰的那部分缓存，如果用链表连起，如果替换，那么中文字体是不是就可以直接替换到原本是中文字体空下来的部分。（同样字号的中文Glphy是不是都是同一大小？） 2. 如果是类似阅读器的场景（如：QQ阅读），如果用户不停的进行翻页操作。经过我暴力测试，QQ阅读会出现崩溃情况。我猜这个可能和字体有关。在这种场景下，是不是一开始直接加载满常用字体会更好。（顺带吐槽一下，他们家对于epub基本翻几页就会崩溃，我猜是缓存策略问题。） 3. 如果超出了一张纹理，为了减少drawcall，是不是也需要做纹理间的优先级区块替换。另外，前面玩过一下，感觉SDF对于outline/shadow...这些效果很友好，不知道有没有大规模的工业应用呢。 P.S. 正在看看了下hwui和skia相关部分的实现，如果有问题，可能还会再叨扰下。

Posted by: foxerzhou | (11) August 9, 2020 09:01 PM

@YuqiaoZhang 我正在用 imgui 做工具，计划用 RmlUI 作 runtime 。但是针对中文的字体管理，现在并没有看到有做得过的去的开源库。这个首先就必须东亚开发人员做，西方主流开发人员根本不关心 glyph 数量太多的问题。甚至他们对 Unicode 就不太上心。我这几年已经给 3,4 个热门开源库修了 UTF-16 的处理 bug 了。imgui 在我提 pr 之前，连 Plane 0 之外都懒得支持。

Posted by: Cloud | (10) July 23, 2020 11:29 AM

嗯，我没理解对。之前看到你在把codepoint和fontid合并就想到应该用perfect hash，但是这个表不是固定大小的，所以也可能用不太上（可以自己搜一个好的hash function？）。不过这种一般类似cache的表好像也不大处理冲突，直接用个cuckoo hashing的做法把一个slot给直接evict掉好了，避免一些pathological cases。

Posted by: Liu Liu | (9) July 22, 2020 12:40 PM

云风不考虑使用第三方库吗？UI一般认为是引擎的边缘部分，即使国际上很有名的公司，也普遍使用第三方库？

Posted by: YuqiaoZhang | (8) July 21, 2020 05:27 PM

毛遂自荐下，我觉得我搞的这个动态字体生成还是不错的。 https://github.com/matrix3d/spriteflexjs/blob/master/src/flash/__native/te/CharSet.as 支持htmltext https://github.com/matrix3d/spriteflexjs/blob/master/src/flash/text/TextField.as#L221

Posted by: lizhi | (7) July 21, 2020 11:46 AM

大神啊

Posted by: yongxinchang | (6) July 20, 2020 10:46 AM

这个 hash map 是不断的动态构建的。prefect hash 有什么优势？冲突又有什么劣势？

Posted by: Cloud | (5) July 18, 2020 03:34 PM

为啥hash map会有冲突？可以直接用perfect hash吧，类似cmph这样的：http://cmph.sourceforge.net/

Posted by: Liu Liu | (4) July 18, 2020 01:34 PM

@mingchen 我觉得慢的话可以把 cache 的贴图持久化到文件系统中。另外可以试试 https://github.com/memononen/SDF

Posted by: Cloud | (3) July 18, 2020 09:59 AM

之前用stb运行时生成sdf buffer挺慢的，手机平台几乎没法忍受，后来改为预渲染了

Posted by: mingchen | (2) July 17, 2020 05:33 PM

云风大哥厉害，请收下小弟的膝盖~

Posted by: 蜗牛 | (1) July 17, 2020 09:39 AM

云风的 BLOG

思绪来得快去得也快，偶尔会在这里停留

动态字模的管理

Comments

Post a comment