新华字典12-[结项]20220917

总的来说,希望楼主努力越来越完善! :grin: :grin: :grin:

这个必须感谢点赞了!

国内出版界可能用的GB18030编码,可以兼容到Unicode ExtB字符集,从ExtC以后的字符都被干到了私有区

看源数据如果有自带字体我就直接拿字体来用方便一点,没有的话再考虑图片。像楼上改版css如果实在要去掉字体的话,也可以用图片代替,或者base64(不过有些软件不支持base64编码)。

对于外汉/汉外词典倒无所谓,某些类推简化字可以直接替换成繁体。不过汉语词典我想还是精确点,多关注一下字形,虽然它们无法被检索(不过我在考虑做拼音索引和部首索引等方式)

4 个赞

自带黑体的显示是最全的,其它字库总会无法显示或者正确显示极少数异体字。感谢作者的辛勤工作,希望这个字典越来越好

这是完美版吗?

1 个赞

新华字典汉英双语吗?有新版,今年1月出的

1 个赞

我剛好為了別的字典而查這個字。

賨:𰷥
U+30DE5

剩下那一小半是校对

2 个赞

超级棒,感谢

请问楼主:这个字级和总笔画数显示是从哪里来的?新华字典12版原书并没有这项设置。

官方APP
还有一个部首信息留作检字表用

1 个赞

世()
image
可以考慮把私有區的字形掛在U+20994“𠦔”。上面的“十”沒有接到下面,但可以算是同一個字。這樣兩全:私有區字改成標準碼,又保留了字典的字形。

窑(、窯)
image
字典沒用上“窰”的碼位,我建議把私有區字形掛在“窰”:U+7AB0。這個碼位本來就包含了(“統一”了)不同字體 – 包括字典指的字體。Unicode Code Chart的參考資料:
image
https://www.unicode.org/charts/

hei_xhzd.ttf (4.6 MB)

以下字头的异体字都是各种港澳台字形:

搢、缙(縉)、麹(麴)、珊、窑(窰)、望

至于要不要把私有区的码位移过来目前的意见是保留,一方面港澳台字形只是看起来像但一些笔画细节(比如长短弯直)还有点区别,另外假如有人拿去做样式改版,使用了其他字体替代,那么该码位上的字肯定不能显示正确。

然后是「世」的异体字,看了下其他汉语词典的数据版用的是「卋」(0x534B),我也使用了这个字的索引,现汉6、新华10等旧版本都是最下一横出头的,反正只要最终显示正确,就不用在意映射到哪个码位了,毕竟Unicode的那些字形都不符合
QQ截图20210729

1 个赞

嗯嗯。反正字頭沒有私有區字最重要,釋文裡出現就無所謂。
我只不過剛寫了個macro來查出私有區字,不知該在哪裡試用,就想起你的mdx了呵呵。只是這個意思。

HQ ICON现在打不开了404。是不是分享了很多词典图标啊?层主有存档吗?能否分享一下?

楼主,我想问一下,这个词头是全的嘛?


但是这个问题没有任何意义

1 个赞

部首信息怎么查

2 个赞

目前暂无此功能

1 个赞

《新华字典》里还有没编码的字吗?能举个例子吗?

1 个赞