现代汉语词典第7版-手机版

做了第2轮修改。单是修改就如此耗时,原版逐个词切图,其艰辛可想而知。

我第一次做mdict,做出来的东西,自己虽然能用,是否会改出新的问题,尚未可知。

还剩交叉索引没做。在考虑把《现汉7》中“也说”的资料用程式抽取,做成交叉索引。

也思考是否要把切图的页码提取出来。也许不要弄得太复杂?越复杂越容易造成意想不到的问题。

把这一轮修改的笔记先发出来,供大家参考。

<增补2>词头修改
乳浊液:乳状液
撞骗:撞脸
开心丸儿:开心丸。
西南非:西南亚。(按:《现汉7》已删“西南非”。)

<增补2>增补词头
快照
天军
推升:有两个“推算”,第一个应为“推升”。
推手:有两个“推头”,第一个应为“推手”。
物语
移录
移民
积垢
订位
订阅
成事不足,败事有余
K粉:有两个“K线”,第一个应为“K粉”。
泪奔:有两个“泪痕”,第一个应为“泪奔”。
气缸
气割
排位
排箫
侧室

处理了几个在Emeditor中无法显示的难字。这几个字贴到Babelpad和Word,虽然能显示,但都给出了错误的字,而且是截然不同的错字,不处理不行。

Emeditor能显示、但Goldendict中无法显示的难字,就不管了。我猜测用css设定字头用超大字符字型,也许能解决Goldendict难字显示问题。有经验的书友请说一下自己的看法。

{钅且}:鉏
{钅且}铻:鉏铻
(门合}:閤
{钅麦}:䥑。

4 Likes

做了第3轮修改。

修改这个mdict出人意料地麻烦。改到这个阶段,发现了几百个非规范Unicode汉字(私用区字),必须一个一个研究,转换成规范Unicode汉字。估计还得做挺久,先贴一些修改笔记。

这个图像版,我决定谨慎一点,采用比较保守(但可靠)的技术路线,重视资料的可靠性过于美观。
宁可使用可检索的繁体字、异体字或拼字({xx}),不使用后起的刚加入Unicode的类推简化字,也决定不绑定某一字型的私用区汉字,因为可能在不同系统上显示完全不同的错字。

这个路线与Quantus的文字版相反。所以我这个版的交叉索引在有类推简化字的字头会刚好相反。Quantus的文字版,输入繁体字跳转到类推简化字。我的版,输入类推简化字(假如有办法输入),会跳到类推简化字的繁体字头。

另外加入一些拼字跳转,例如输入{金麦},会跳转到“䥑”的字头。

{口恶}、二{口恶}英:噁、二噁英(图像版“”(U+E15E)非unicode正字。)
{忄农}、懊{忄农}:憹、懊憹 (图像版“”(U+E1D8)非unicode正字。)
{甫鸟}、地{甫鸟}:鵏(图像版“”(U+E135)非unicode正字。)
{王乐}、玓{王乐}:瓅(图像版“”(U+E058)非unicode正字。)
{土劳}、圪{土劳}:𡑍(图像版“”(U+E0E1)非unicode正字。)
{金母}、钴{金母}:鉧(图像版“”(U+E0EC)非unicode正字。)
{阝贵}、虺{阝贵}:隤(图像版“”(U+E120)非unicode正字。)
{马是}:騠(图像版“”(U+E150)非unicode正字。)
{木党}、簕{木党}:欓(图像版“”(U+E172)非unicode正字。)
{王帝}、玛{王帝}脂:{王帝}(图像版“”(U+E153)非unicode正字。)
{金荅}、铁{金荅}:鎝(图像版“”(U+E179)非unicode正字。)
䓖、芎䓖(U+44D6):藭、芎藭。(图像版兼用䓖(U+44D6)、“”(U+E840)。“”(U+E840)非unicode正字。)
{金其}、镃{金其}:錤(图像版“”(U+E163)非unicode正字。)
蠷:蠼。(二字同字,皆可检索,《现汉7》规范字为“蠼”。)
:韡。(图像版“”(U+E050)非unicode正字。)
{糸林}、{糸林}𫄥、{糸林}缡:綝。(图像版“”(U+E051)非unicode正字。)
{王莹}:㼆。(图像版“”(U+E052)非unicode正字。)
{木丽}:欐。(图像版“”(U+E059)非unicode正字。)
{竹贡}。篢(图像版“”(U+E05B)非unicode正字。)
𫞩。璊(图像版“”(U+E05C)非unicode正字。)
{日韦}。暐(图像版“”(U+E05E)非unicode正字。)
{王寻}。璕(图像版“”(U+E05F)非unicode正字。)
{日见}。晛(图像版“”(U+E060)非unicode正字。)
{糸川}。紃(图像版“”(U+E061)非unicode正字。)
{弓区}。彄(图像版“”(U+E068)非unicode正字。)
{牙合}。{牙合}(图像版“”(U+E06B)非unicode正字。)
{食长}:餦(图像版“”(U+E075)非unicode正字。)
{言禾}:訸(图像版“”(U+E077)非unicode正字。)
{口邦}:{口邦}(图像版“”(U+E07B)非unicode正字。)
{凵了}:{凵了}(图像版“”(U+E083)非unicode正字。)
{言于}:訏(图像版“”(U+E085)非unicode正字。)
{氵万}:澫(图像版“”(U+E08B)非unicode正字。)
{土区}:塸(图像版“”(U+E091)非unicode正字。)
{土仑}:埨(图像版“”(U+E092)非unicode正字。)
{艹为}:蔿(图像版“”(U+E095)非unicode正字。)
{车兀}:軏(图像版“”(U+E096)非unicode正字。)
{山历}:㠣(图像版“”(U+E098)非unicode正字。)
{氵无}:潕(图像版“”(U+E09A)非unicode正字。)
{氵韦}:湋(图像版“”(U+E09B)非unicode正字。)
{氵专}:漙(图像版“”(U+E09C)非unicode正字。)
{氵贝}:浿(图像版“”(U+E09D)非unicode正字。)
{言戋}:諓(图像版“”(U+E09E)非unicode正字。)
{王从}:瑽(图像版“”(U+E0A6)非unicode正字。)
{马文}:馼(图像版“”(U+E0A2)非unicode正字。)
{艹只}:{艹只}(图像版“”(U+E0A8)非unicode正字。)
{车氏}:軝(图像版“”(U+E0A9)非unicode正字。)
{言艮}:詪(图像版“”(U+E0B2)非unicode正字。)
{寻阝}:鄩(图像版“”(U+E0B3)非unicode正字。)
{阝岂}:隑(图像版“”(U+E0B4)非unicode正字。)

𫗮。餭。
𫄥:纚
敻(U+657B):夐(U+5910)。
𫘝:駃
蘥:籥
酴醿:酴醾

4 Likes

changelog 是必要的。
其实修订这活,论坛回帖留痕最好,微信群什么的要注意个人隐私和法律风险

2 Likes

贊同這種修訂方式,盡量不用類推簡化字,最好用傳統正體字,可靠準確,容易檢索。

2 Likes

shaoshi兄辛苦了!

这个思路好。不过可不可以考虑更简单的输入,比如在金麦前加个逗点等。

我个人的资料库都是这样处理拼字的:{XX}。统一格式。加{}是为了防止和正常的字相混。

sxingbai兄假如喜欢别的拼字方式,更改了自用也很容易,统一替换就行。

1 Like


image
image

我對這個字典不熟,不知道按頁碼排次,字典歸哪個部首。以字形來說,應當是“夐5910”。
夐5910:按Unicode的定義,从sui夊。部件右上角不凸出。
敻657B:按Unicode的定義,从pu攵。右上角凸出来。
部件左邊的差距,各個電子字型效果不同;細明(ML)和全宋體(FS)分辨得最清楚。

我用搜狗輸入法,打xiong,會先出現5910,然後657B排在下一頁。反正兩個字容易搞混,適合加跳轉。漢語大詞典(電子版)處理這兩個字簡直是一團亂。

有 蔿、蒍 兩個字。


shaoshi列的私有區字是 辭源和开心宋 字型的,做完這個替代工作,也許可以做出一部分的开心宋私有區轉換表,能用在别的mdx上。只不過开心宋版本不同,弄出来的表不見得十分可靠。字型畢竟有65K字的限制,使用者覺得不夠用就重新利舊的碼位,使得碼位與字形的關係不穩定。
上面列的私有區字只有0平面(Plane 0)的;平面15(FXXXX)有更多,好像沒出現在這個mdx。平面15的字,我可以抽出一個幾千字的轉換表,但看起來你在這裡用不上。

1 Like

Mastameta兄看来对字型颇有研究,我正想开始研究字型,正好请教。

1.有没有可免费下载的字型浏览、编辑软件?如果可以,请介绍一两个,能附上下载地址更好。

2.有没有可靠的办法让Goldendict展示后出的类推简化字?或者能否找到一个包含《现汉7》所有单字的字型?

Chrome可以展示后出的Unicode汉字,Goldendict的网页引擎显然老旧了,不行。

我发现本坛的《新华字典》可以让Goldendict展示一些后出的Unicode汉字。

新华字典12版

研究了一下,发现是在css里指向专用字型hei_xhzd.ttf(字型内名字为swg_xhzd)。

把这个《新华字典》和《现汉7》放在Goldendict里并用了一段时间,发现这个字型甚至无法展现《新华字典》的某些字,《现汉7》的字当然更不用说。

网页的css 里可以指向全宋体,但是查询界面上还是六条横线,这个不知道怎么处理。

321

全宋体用的是复合字体,在注册表内把几个字型定义为一种字体来使用。

我估计比较旧的软件不能使用复合字体。

假如用单一字型,除非能找到一个包含所有《现汉7》单字的单一字型,否则用不起来。

FontCreator

官方APP有一枚hei.ttf(非衬线)和song.ttf(衬线)字体可显示,但需要修改,它的很多本来Unicode已收的字符都放到了私有区

在GoldenDict配置目录下有 article-style.css 和 qt-style.css 文件可修改字体,详见GoldenDict 界面显示风格、字体、背景等等的修改[20150904] - GoldenDict - 掌上百科 - PDAWIKI - Powered by Discuz!

3 Likes
  1. 我用FontLab,500美金的專業軟件,私下給你發了下載方式。
    很多人用免費的https://fontforge.org/。他不穩定,經常會崩潰,也有撐不住的狀況,有的字型裝載不了(除非用python繞開他的界面)。
  1. 《现代汉语词典》第7版是2016出版的,應當符合《通用规范汉字表》(2013)的規範,因此限制了類推簡化的使用範圍。但我對這個字典不熟,不知道具體用了什麼類推字。Unicode方面,我分析了一下數據,是這樣分配的:
  • Unicode 5.2 (2009)加了500多類推字在 C 擴展區;
  • Unicode 8.0 (2015)加了1000左右類推字在 E 區;
  • Unicode 10.0(2017)加了175在 F 區;
  • Unicode 13.0(2020)加了1,200多在 G 區;
  • Unicode 14.0(今年九月份)要加“𫜷”(⿰寿⻏;U+2B737)。全宋體已經提早支持。

總之,所謂“后出的类推简化字”在C、E、F、G區。

  • Windows SimSun-ExtB 只更新到 8.0 的E區,而且所支持的E區簡體字只有10%。
  • 中華書局字型(ZhongHuaSongPlane*.ttf)的支持達到 10.0 的F區,沒有 13.0 的G區。
  • 全宋體有所有Unicode簡體字。
    別的字型不提,不是mdx群體常用的。

所謂“复合字体”只影響Windows的註冊,跟遊覽器、MDict、GD沒有關係。因為CSS需要分別指定字型文件,復合字型也得分別點名。CSS可以這樣寫:

  • font-family: serif, SimSun, SimSun-ExtB, FSung-2, FSung-3, FSung-F
    "serif"等於是系統的默認宋體字型,這裡主要是針對手機,手機沒有Windows SimSun。

有的字頭也許要特別調font-family,但大多情況下這個CSS寫法會符合該字典的字體。(簡體字寫法畢竟是固定的,沒有字體的分歧。)

另外的做法是用FontLab什麼的來抽出你需要的碼位-字形,作個特製TTF,但不值得那樣費工,除非數量不多。

3 Likes

感谢Mastameta指教,兄台的知识和所用的软件都很专业。

我需要用字型的机会不多,假如使用,大概就试一下免费软件。

假如调整Goldendict的词典字体设定或设置词典的css能解决问题,我当然就不管字型制作了。我的兴趣毕竟在资料而不在字型设计。

我曾经用Unicode的数据unihan.zip做了一个Access的汉字资料库,再加入笔画码的数据,用部首加笔画码检索,用起来挺顺手。

但是我的资料库只有7万多字,许多还没有笔画码,也缺少后出的类推简化字,要处理这个有不少类推简化字的《现汉7》mdict,就寸步难行。

看到本坛的《叶典》mdict说明有“两分法”检索,得到灵感。用getdict解开mdict,把有“两分法”跳转的Unicode汉字都收入我的Access资料库,再加入“两分法”数据。

现在我的Access资料库有9万多字,新增加的2万多字有很多无法显示。但是类推简化字都有了,可以用“两分法”检索。

所以现在处理的速度稍微快了一点。

第4轮修改

{马丕}:駓(图像版“”(U+E0BA)非unicode正字。)
{阝齐}:隮(图像版“”(U+E0B5)非unicode正字。)
{马冋}:駉(图像版“”(U+E0BC)非unicode正字。)
{土夅}:{土夅}(图像版“”(U+E0C3)非unicode正字。)
{艹问}:蔄(图像版“”(U+E0C4)非unicode正字。)
{艹那}:{艹那}(图像版“”(U+E0C5)非unicode正字。)
{目见}:睍(图像版“”(U+E0CA)非unicode正字。)
{山/成}:峸(图像版“”(U+E0CB)非unicode正字。)
{山曲}:{山曲}(图像版“”(U+E0CC)非unicode正字。)
{钅夫}:鈇(图像版“”(U+E0CD)非unicode正字。)
{钅长}:鋹(图像版“”(U+E0CF)非unicode正字。)
{钅仑}:錀(图像版“”(U+E0D1)非unicode正字。)
{女华}:嬅(图像版“”(U+E0D8)非unicode正字。)
{糸因}:絪(图像版“”(U+E0D9)非unicode正字。)
{马先}:駪(图像版“”(U+E0DA)非unicode正字。)
{糸延}:綖(图像版“”(U+E0DC)非unicode正字。)
{糸廷}:綎(图像版“”(U+E0DB)非unicode正字。)
{责力}:勣(图像版“”(U+E0DF)非unicode正字。)
{木夹}:梜(图像版“”(U+E0E4)非unicode正字。)
{支页}:頍(图像版“”(U+E0E5)非unicode正字。)
{车光}:輄(图像版“”(U+E0E6)非unicode正字。)
{山/大/车}:輋(图像版“”(U+E0E7)非unicode正字。)
{钅术}:鉥(图像版“”(U+E0E8)非unicode正字。)
{钅卢}:鑪(图像版“”(U+E0E9)非unicode正字。)
{钅申}:鉮(图像版“”(U+E0EA)非unicode正字。)
{钅召}:鉊(图像版“”(U+E0EB)非unicode正字。)
{亻单}:僤(图像版“”(U+E0EE)非unicode正字。)
{饣束}:餗(图像版“”(U+E0F2)非unicode正字。)
{火寻}:燖(图像版“”(U+E0F5)非unicode正字。)
{阝兒}:{阝兒}(图像版“”(U+E0F7)非unicode正字。)
{马余}:駼(图像版“”(U+E0FE)非unicode正字。)
{纟希}:絺(图像版“”(U+E0FF)非unicode正字。)
{纟完}:綄(图像版“”(U+E100)非unicode正字。)
{丰刀/石}:䂮(图像版“”(U+E102)非unicode正字。)
{土单}:墠(图像版“”(U+E105)非unicode正字。)
{艹卓}:䓬(图像版“”(U+E108)非unicode正字。)
{石达}:䃮(图像版“”(U+E10B)非unicode正字。)
{由页}:頔(图像版“”(U+E10E)非unicode正字。)
{虫东}:蝀(图像版“”(U+E10F)非unicode正字。)
{钅圭}:銈(图像版“”(U+E111)非unicode正字。)
{钅共}:鉷(图像版“”(U+E112)非unicode正字。)
{钅达}:鐽(图像版“”(U+E113)非unicode正字。)
{贸阝}:鄮(图像版“”(U+E117)非unicode正字。)
{氵国}:漍(图像版“”(U+E119)非unicode正字。)
{汤/玉}:璗(图像版“”(U+E11A)非unicode正字。)
{讠垔}:諲(图像版“”(U+E11C)非unicode正字。)
{讠咸}:諴(图像版“”(U+E11D)非unicode正字。)
{讠是}:諟(图像版“”(U+E11E)非unicode正字。)
{讠叟}:謏(图像版“”(U+E11F)非unicode正字。
{纟青}:綪(图像版“”(U+E123)非unicode正字。
{马非}:騑(图像版“”(U+E124)非unicode正字。
{马匋}:騊(图像版“”(U+E125)非unicode正字。
{纟京}:綡(图像版“”(U+E126)非unicode正字。
{纟享}:綧(图像版“”(U+E127)非unicode正字。
{马录}:騄(图像版“”(U+E128)非unicode正字。
{土娄}:塿(图像版“”(U+E131)非unicode正字。
{土扁}:{土扁}(图像版“”(U+E132)非unicode正字。
{木质}:櫍(图像版“”(U+E134)非unicode正字。
{车兒}:輗(图像版“”(U+E137)非unicode正字。
{齿介}:齘(图像版“”(U+E138)非unicode正字。
{目闰}:瞤(图像版“”(U+E139)非unicode正字。

4 Likes

抽查了一些字,推测《现汉7》mdict图像版用的字型是TH-Tshyn-P0,这是天珩全字库 (叶典字体)的字型之一。

第5轮修改

{目间}:瞷(图像版“”(U+E13A)非unicode正字。
{足母}:{足母}(图像版“”(U+E13B)非unicode正字。
{岂页}:顗(图像版“”(U+E13C)非unicode正字。
{金杜}:{金杜}(图像版“”(U+E13E)非unicode正字。
{金求}:銶(图像版“”(U+E13F)非unicode正字。
{钅宏}:鋐(图像版“”(U+E141)非unicode正字。
{兆页}:頫(图像版“”(U+E142)非unicode正字。
{危页}:頠(图像版“”(U+E145)非unicode正字。
{狂鸟}:鵟(图像版“”(U+E147)非unicode正字。
{广钦}:廞(图像版“”(U+E149)非unicode正字。
{门垔}:闉(图像版“”(U+E14A)非unicode正字。
{火单}:燀(图像版“”(U+E14B)非unicode正字。
{马砉}:騞(图像版“”(U+E14F)非unicode正字。
{酉农}:醲(图像版“”(U+E157)非unicode正字。
{石肯}:{石肯}(图像版“”(U+E158)非unicode正字。
{车酋}:輶(图像版“”(U+E15B)非unicode正字。
{车柔}:輮(图像版“”(U+E15C)非unicode正字。
{钅享}:錞(图像版“”(U+E165)非unicode正字。
{金波}:{金波}(图像版“”(U+E166)非unicode正字。
{鱼句}:鮈(图像版“”(U+E167)非unicode正字。
{鱼它}:鮀(图像版“”(U+E168)非unicode正字。
{月娄}:膢(图像版“”(U+E169)非unicode正字。
{门臬}:闑(图像版“”(U+E16A)非unicode正字。
{衤责}:襀(图像版“”(U+E16C)非unicode正字。
{君页}:頵(图像版“”(U+E16D)非unicode正字。
{马原}:騵(图像版“”(U+E16E)非unicode正字。
{马奚}:騱(图像版“”(U+E16F)非unicode正字。
{土康}:{土康}(图像版“”(U+E170)非unicode正字。
{匽鸟}:鶠(图像版“”(U+E173)非unicode正字。
{石览}:{石览}(图像版“”(U+E175)非unicode正字。
{石咢}:{石咢}(图像版“”(U+E176)非unicode正字。
{此/鱼}:鮆(图像版“”(U+E177)非unicode正字。
{金泉}:䤼(图像版“”(U+E17A)非unicode正字。
{钅侯}:鍭(图像版“”(U+E17B)非unicode正字。
{竹参}:篸(图像版“”(U+E17C)非unicode正字。
{鱼师}:鰤(图像版“”(U+E17F)非unicode正字。
{鱼兆}:鮡(图像版“”(U+E180)非unicode正字。
{鱼危}:鮠(图像版“”(U+E181)非unicode正字。
{狱/鸟}:鸑(图像版“”(U+E183)非unicode正字。
{族/鸟}:鷟(图像版“”(U+E1A9)非unicode正字。
{讠惠}:譓(图像版“”(U+E187)非unicode正字。

《现汉7》图像版字头的非规范Unicode汉字总算完全清理完毕。

第6轮修改

{纟寅}:縯(图像版“”(U+E188)非unicode正字。
{钅翁}:鎓(图像版“”(U+E18C)非unicode正字。
{鱼免}:鮸(图像版“”(U+E18D)非unicode正字。
{马粦}:驎(图像版“”(U+E194)非unicode正字。
{艹频}:蘋(图像版“”(U+E19A)非unicode正字。
{车遂}:䡵(图像版“”(U+E19C)非unicode正字。
{齿奇}:齮(图像版“”(U+E19D)非unicode正字。
{齿兒}:齯(图像版“”(U+E19E)非unicode正字。
{虫扇}:{虫扇}(图像版“”(U+E1A1)非unicode正字。
{山献}:巘(图像版“”(U+E1A3)非unicode正字。
{钅彗}:鏏(图像版“”(U+E1A4)非unicode正字。
{钅黄}:鐄(图像版“”(U+E1A5)非unicode正字。
{钅敝}:䥕(图像版“”(U+E1A6)非unicode正字。
{王献}:瓛(图像版“”(U+E1AC)非unicode正字。
{金喜}:{金喜}(图像版“”(U+E1AE)非unicode正字。
{金黑}:{金黑}(图像版“”(U+E1AF)非unicode正字。
{钅番}:鐇(图像版“”(U+E1B0)非unicode正字。
{钅粦}:鏻(图像版“”(U+E1B1)非unicode正字。
{钅尊}:鐏(图像版“”(U+E1B2)非unicode正字。
{钅遂}:鐩(图像版“”(U+E1B3)非unicode正字。
{钅矞}:鐍(图像版“”(U+E1B4)非unicode正字。
{番鸟}:鷭(图像版“”(U+E1B5)非unicode正字。
{鱼柬}:鰊(图像版“”(U+E1B7)非unicode正字。
{既/鱼}:鱀(图像版“”(U+E1BA)非unicode正字。
{纟熏}:纁(图像版“”(U+E1BC)非unicode正字。
{王綦}:{王綦}(图像版“”(U+E1BD)非unicode正字。
{艹鬲/鸟}:虉(图像版“”(U+E1BF)非unicode正字。
{童羽}:{童羽}(图像版“”(U+E1C3)非unicode正字。
{曾羽}:䎖(图像版“”(U+E1C4)非unicode正字。
{纟墨}:纆(图像版“”(U+E1C6)非unicode正字。
{瞿阝}:{瞿阝}(图像版“”(U+E1CA)非unicode正字。
{鱼喜}:鱚(图像版“”(U+E1CB)非unicode正字。
{斌/金}:{斌/金}(图像版“”(U+E1CC)非unicode正字。
{纟襄}:纕(图像版“”(U+E1CE)非unicode正字。
{王燮}:{王燮}(图像版“”(U+E1CF)非unicode正字。
{齿楚}:齼(图像版“”(U+E1D0)非unicode正字。
{火巴}:{火巴}(图像版“”(U+E1D4)非unicode正字。
{卒瓦}:{卒瓦}(图像版“”(U+E1DC)非unicode正字。
{亻龙}:儱(图像版“”(U+E1E9)非unicode正字。
{亻刍}:㑇(图像版“”(U+E81B)非unicode正字。
{口呙}:喎(图像版“”(U+E81F)非unicode正字。
{忄刍}:㤘(图像版“”(U+E825)非unicode正字。
{扌双}:㧐(图像版“”(U+E82A)非unicode正字。
{氵达}:㳠(图像版“”(U+E82F)非unicode正字。
{月专}:䏝(图像版“”(U+E83F)非unicode正字。
{讠斤}:䜣(图像版“”(U+E844)非unicode正字。
{钅著}:䦃(图像版“”(U+E84D)非unicode正字。
{门争}:䦶(图像版“”(U+E853)非unicode正字。
{门坐}:䦷(图像版“”(U+E852)非unicode正字。
{鱼印}}:䲟(图像版“”(U+E857)非unicode正字。
{鱼春}}:䲠(图像版“”(U+E858)非unicode正字。
{帀鸟}:䴓(图像版“”(U+E85C)非unicode正字。
{龙/天}:䶮(图像版“”(U+E863)非unicode正字。

我已经把我微调过的mdx发出来:

现代汉语词典7版图像切词版微调

另外做了一个《现汉7》页码索引,有兴趣的书友可以参看:

《现汉7》页码索引

7 Likes

最近对照了APP版的字头数据,发现「纂」的异体字(撰、馔的异体字同)错误,在APP里显示的是「篹」,但纸书上为𥲻(Unicode码25CBB)然后APP附带的字体也没有该字形,于是最终也没有一个字体能显示现汉7的所有单字。只好从其他字体提取该码位的字形加进去了。
EDIT: 神奇的是这个字形居然能在新华12附带的那枚字体中找到,看来《新华12》和《现汉7》的字体应该可以合并

新华APP自带的黑体确实不能够显示所有字头,如圙的异体字、奔的异体字等,后来我就从另外一枚字体(衬线)提取这几个字形加进去,目前的hei_xhzd.ttf已经能够显示新华12的所有字头,如果还不能那就是词典软件的问题。当我看到

那么就解释得通了

3 Likes

请问大家在哪里下载的现代汉语词典第七版的mdd文件呀

2楼就是图片版mdd。

4 Likes

图片版见 2 楼 附件,保存时,注意文件名。

文字版 见 现代汉语词典7-[施工现场]20220918
附件,这个文字版错误极少了。不要找别的。

参看:

Xh7研修版,2024年1月