常用字库的汉字收录情况

下面是常用字库的汉字收录情况摘要。
这里只谈汉字的收录数量,不谈字体的美观或质量。

我的大部分字库是随 Windows 7 系统及办公程序附带安装的,我没有刻意去收集,而99%情况下,我也只会用到:宋体/仿宋/黑体/楷体/雅黑等,它们基本都支持GB18030。
除此以外,因为天珩宋体是对Unicode 13完全支持的,因此我偶尔用于显示异体字,特别是类推简化字。
中华书局宋体是对Unicode 12完全支持的,可惜不支持G区扩展,因此实际未用。
极少数很特别的汉字,例如十以上的中文带圈序数,不得已还是得用程序自带的字库。


宋体 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,910 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

仿宋/黑体/楷体 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

微软雅黑 【GB18030】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,909 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

宋体-方正超大字符集 【GB18030+】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)
中日韩统一表意文字扩展B区 (含 36,862 字符,共 42,718 字符)

SimSun-ExtB
中日韩统一表意文字扩展B区 (含 42,711 字符,共 42,718 字符)

细明体/新细明体 【GB18030】
中日韩兼容表意文字 (含 302 字符,共 472 字符)
中日韩统一表意文字 (含 20,916 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

华文宋体/华文楷体 【GBK】
中日韩兼容表意文字 (含 21 字符,共 472 字符)
中日韩统一表意文字 (含 20,902 字符,共 20,989 字符)

中华书局宋体00平面 【GB18030】
中日韩兼容表意文字 (含 22 字符,共 472 字符)
中日韩统一表意文字 (含 20,976 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,582 字符,共 6,592 字符)

中华书局宋体02平面 【00+02:涵盖Unicode 12中全部CJK汉字】
中日韩统一表意文字扩展B区 (含 42,711 字符,共 42,718 字符)
中日韩统一表意文字扩展C区 (含 4,149 字符,共 4,149 字符)
中日韩统一表意文字扩展D区 (含 222 字符,共 222 字符)
中日韩统一表意文字扩展E区 (含 5,762 字符,共 5,762 字符)
中日韩统一表意文字扩展F区 (含 7,473 字符,共 7,473 字符)
中日韩兼容表意文字增补集 (含 542 字符,共 542 字符)

中华书局宋体15平面
增补私用A区 (含 42,057 字符,共 65,534 字符)

天珩宋体/TH-Sung-TP0
中日韩兼容表意文字 (含 472 字符,共 472 字符)
中日韩统一表意文字 (含 20,989 字符,共 20,989 字符)
中日韩统一表意文字扩展A区 (含 6,592 字符,共 6,592 字符)
中日韩统一表意文字扩展G区 (含 4,939 字符,共 4,939 字符)

天珩宋体/TH-Sung-TP2 【TP0+TP2:涵盖Unicode 13中全部CJK汉字】
中日韩统一表意文字扩展B区 (含 42,718 字符,共 42,718 字符)
中日韩统一表意文字扩展C区 (含 4,149 字符,共 4,149 字符)
中日韩统一表意文字扩展D区 (含 222 字符,共 222 字符)
中日韩统一表意文字扩展E区 (含 5,762 字符,共 5,762 字符)
中日韩统一表意文字扩展F区 (含 7,473 字符,共 7,473 字符)
中日韩兼容表意文字增补集 (含 542 字符,共 542 字符)

7 个赞

GB2312呢?有些mdx是GB2312编码

GB18030包含GBK,GBK包含GB2312。现在的常用字库,甚至方正的一些书法字库,都基本支持GBK了。

文件编码与字库的关系不大,如果mdx是GB2312编码,超出范围的字符当然是无法正确显示的,一旦保存文件后这些字符也就不可逆地丢失了,需要重新找到源文件,将其编码转成UTF-8等。

1 个赞

很有帮助,谢谢总结!

补充:

  1. WFG - 『全宋体』 WFG: 漢字使用環境的建置 ——十八萬漢字初稿登場
  2. “中华民国行政院国家发展委员会” - CNS11643中文标准交换码全字库(简称全字库)中文全字库(全字库楷体、全字库宋体)
  3. 字海(叶典) - 天珩字库 源于中易、华康、Iwata、Besta、方正等,目前字符数量最全的字体支持包,其中汉字部分支持14余万,主要设计为大陆风格。
1 个赞

试了试,感觉好像是全宋体的字最全吧?

2 个赞

文津宋体

一套以思源宋体及其衍生版本、利用GlyphWiki数据和修改版Kage引擎生成的汉字为主进行二次开发的大字符集宋体字库,实现Unicode定义的汉字全覆盖,汉字字形主要以中国大陆地区字形标准呈现。该字体系列采用OFL协议,任何个人与团体均可免费商用。
当今免费商用乃至开源的汉字大字符集字库相对较少,而且可免费商用的宋体大字符集字库几乎没有按照中国大陆字形标准。因此,如果您在选用可免费商用的宋体大字符集字库,文津宋体不失为一个较好的选择。
除此之外,文津宋体还支持多种拼音和注音系统,并配备了多种OpenType特性可供自由调用,主要包括字形标准切换、拼音/注音变种符号支持、注音符号竖排支持、带标字符的正确定位、标点挤压等。




SuperHan

一套以思源宋体及修改版Kage引擎生成的汉字为主进行二次开发的大字符集宋体字库,字形主要以中国大陆地区字形标准呈现。
ttf/SuperHan[0|2|3]ivd.ttf 三个单独的TrueType字体文件,每个字体文件包含对应平面的字符,数字代表平面编号。
(0—BMP,基本多文种平面;2—SIP,扩展表意文字平面;3—TIP,表意文字第三平面)
ttf/SuperHanivd.ttc 包含以上三个字体的整合包。
一般用户仅需在上面的三个TTF文件或者单个TTC文件中任选一组安装即可。
woff/.woff、woff2/.woff2 以上三个字体的网络字体(Webfont)形式,方便网站调用。




Lorchin Sans

一款由 Kage 引擎生成的以WTFPL协议发布并且开源的字体。尽管字形可能不尽如人意,但它的最大特点在于,补全了目前Unicode收录的所有汉字。
本字体现已支援全部位于扩展区的 CJK 统一汉字,及基本区、扩展A、B C D E F G H I和兼容区及兼容补充区的所有汉字。
这种全面的汉字支持,使得 Lorchin Sans 成为在处理中文文本时的一个备选工具。
本字体的 非ttf格式文件 和 合并轮廓版(merge_glyphs) 通过使用FontForge 脚本集合自动化生成。




Fwsong
介绍:Fw 大佬做的统信国标宋体修改版,同时基于「GB 18030—2022《信息技术 中文编码字符集》国家标准第1号修改单」(简称国标一改单)提取出了第三平面字体文件,支持基本区和扩展A~I区,均为大陆字形
下载地址,非官方链接

统信国标宋体
支持字符:
国标GB18030-2022标准
统信系统国标宋体

1 个赞

还有一个
B站绵云饴里大大的典迹汉字Monu Hani字体