常用字库的汉字收录情况

下面是常用字库的汉字收录情况摘要。
这里只谈汉字的收录数量,不谈字体的美观或质量。

我的大部分字库是随 Windows 7 系统及办公程序附带安装的,我没有刻意去收集,而99%情况下,我也只会用到:宋体/仿宋/黑体/楷体/雅黑等,它们基本都支持GB18030。
除此以外,因为天珩宋体是对Unicode 13完全支持的,因此我偶尔用于显示异体字,特别是类推简化字。
中华书局宋体是对Unicode 12完全支持的,可惜不支持G区扩展,因此实际未用。
极少数很特别的汉字,例如十以上的中文带圈序数,不得已还是得用程序自带的字库。


宋体 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,910 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

仿宋/黑体/楷体 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

微软雅黑 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,909 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

宋体-方正超大字符集 【GB18030+】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)
中日韩统一表意文字扩展B区 (含 36,862 字符,共 42,718 字符)

SimSun-ExtB
中日韩统一表意文字扩展B区 (含 42,711 字符,共 42,718 字符)

细明体/新细明体 【GB18030】
中日韩兼容表意文字 (含 302 字符,共 472 字符)
中日韩统一表意文字 (含 20,916 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

华文宋体/华文楷体 【GBK】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)

中华书局宋体00平面 【GB18030】
中日韩兼容表意文字 (含 22 字符,共 472 字符)
中日韩统一表意文字 (含 20,976 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

中华书局宋体02平面 【00+02:涵盖Unicode 12中全部CJK汉字】
中日韩统一表意文字扩展B区 (含 42,711 字符,共 42,718 字符)
中日韩统一表意文字扩展C区 (含 4,149 字符,共 4,149 字符)
中日韩统一表意文字扩展D区 (含 222 字符,共 222 字符)
中日韩统一表意文字扩展E区 (含 5,762 字符,共 5,762 字符)
中日韩统一表意文字扩展F区 (含 7,473 字符,共 7,473 字符)
中日韩兼容表意文字增补集 (含 542 字符,共 542 字符)

中华书局宋体15平面
增补私用A区 (含 42,057 字符,共 65,534 字符)

天珩宋体/TH-Sung-TP0
中日韩兼容表意文字 (含 472 字符,共 472 字符)
中日韩统一表意文字 (含 20,989 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,592 字符,共 6,592 字符)
中日韩统一表意文字扩展G区 (含 4,939 字符,共 4,939 字符)

天珩宋体/TH-Sung-TP2 【TP0+TP2:涵盖Unicode 13中全部CJK汉字】
中日韩统一表意文字扩展B区 (含 42,718 字符,共 42,718 字符)
中日韩统一表意文字扩展C区 (含 4,149 字符,共 4,149 字符)
中日韩统一表意文字扩展D区 (含 222 字符,共 222 字符)
中日韩统一表意文字扩展E区 (含 5,762 字符,共 5,762 字符)
中日韩统一表意文字扩展F区 (含 7,473 字符,共 7,473 字符)
中日韩兼容表意文字增补集 (含 542 字符,共 542 字符)

3 Likes

GB2312呢?有些mdx是GB2312编码

GB18030包含GBK,GBK包含GB2312。现在的常用字库,甚至方正的一些书法字库,都基本支持GBK了。

文件编码与字库的关系不大,如果mdx是GB2312编码,超出范围的字符当然是无法正确显示的,一旦保存文件后这些字符也就不可逆地丢失了,需要重新找到源文件,将其编码转成UTF-8等。