图片词典故訓匯纂文本化过程记录

别用台标字体



由于unicode的认同和分离,两个字形一个码位,一个字形两个码位都是常见的



甚至G和T战术换家


对于小学类数据需要避免这种干扰。
建议使用字统网部件查字,可以看到码表字形
zi.tools


建议使用文津宋体
takushun-wu/WenJinMincho: 可免费商用的大字符集宋体字库,以OFL协议发布。/A large character set fonts in Songti(Mincho) style. Licensed under the SIL OFL 1.1.
建议与G源字形不合的使用IDS。

1 个赞

你说的一会装下字体看下

现在好多东西还叫不准。就拿词头来说,一开始觉得非基本区的拆开可以查到就行了,所以录入是就简单按自己理解的


再加个这东西就完事了。

可有的字根本不是那回事,所以现在正翻回头按这个网站的在录入一遍,可是这个网站也不是都拆开的,没有的按(字統网)拆字录入呢。


有些还是叫不准该用哪个(着手弄这个就发现了,挠脑袋也不行)
顔 顏


U+9854
UTF-8: 0xE9 0xA1 0x94
CJK Unified Ideographs
Unicode 脚本: Hani (Han)
Unicode 的一般类别: Lo (Other Letter)
文件位置:168 字节


U+984F
UTF-8: 0xE9 0xA1 0x8F
CJK Unified Ideographs
Unicode 脚本: Hani (Han)
Unicode 的一般类别: Lo (Other Letter)
文件位置:171 字节

“上”字头的119项

而我这觉得靠谱信息查了下


凡例里写的

我咋保证啊???我也没看到原书,按纸书印刷那可简单了(像这样得按纸书印的绝对不是最好的选择,但也是目前唯一的办法)

你楼上那朋友也说要看下引用书目表


就还拿“颜”字来说我这块都没法下手。


我理解的不是简单的一替换的事,反正没想好咋弄。

不想由于个人的主观二次引入错误。

哈哈哈,先玩词头吧(弄错了也好改 :blush:)。

2 个赞