【停止维护】《汉语大字典[全息]》9.14

9.14
新增扩H汉字。

2021.11.02
扩G增补.txt (305.9 KB)
1.由于书局的自身限制,位于扩G的字头整体缺失。本次增补参考字统网及白云深处人家。
2.其他修订若干。

2021.10.16
本来不想发mdx的,因为实在没有作多少修改,不说达不到大家的预期,我自己的预期也是达不到的。不过既然阿弥陀佛大佬让发,那就发一个吧。

1.汉大有些字合并了,如「胶(肉)㬵(月)」,这样后一个字就没有字头,处理方式是增加「㬵(月)」字头注明『見「胶」(二)①』(此句用<fw></fw>标签包围),并链接到「胶(肉)」,而「胶(肉)」不变,包括释义内对「㬵(月)」的解释,仍用「胶(肉)」。
2.新旧字型(两种字型一个码位)处理方式:汉大兼收的,如「龜」,旧字型用〾分别;只收一个的,如「譌」,直接换成新字型。原则上不使用康熙部首、兼容字、私用区。
3.收集错简计71条,部分字未入U,注明「X页第x字」,未加入增补。部分字不知从何处阑入,注明「待考」。

《汉语大字典[全息]》
看了一下这个词典,文本应该是某书局
龜部缺了一批字,猜想可能是用了PUA,所以没抓到,在此补上,手打的
龜部「龜」字新旧字形兼收,所以旧字形用〾表示。
另有四五个字没入U,没加
龜部增补.txt (12.7 KB)

10 个赞

多谢完善! :heart: :heart:

1 个赞

謝謝!我第一次看這個資料,覺得很驚訝漏了那麼多‘龜’部的字條。

標準字方面,還缺:𪚦、𪚧、𪚫、𪚱、𪚽、𪛃、𪛄

私有區字形方面,還缺:(全宋體)󰱗、󰱘、󰱙、󰱚、󰱛、󰱜

龜字很麻煩,新舊字體佔同一個碼位。不用死字或私有區字來區分,就得讓字頭字碼重出。沒有任何辦法是好的。

[全息] 數據有幾百字條,內容交錯混亂。例如“倚”字條,插進“俹”字條的釋義。也有一百多字條錯誤合併,應該分開,也要補充漏掉的字頭。如果跟紙書對比,應當還有別的事。
[全息] 有編碼的限制,我記得跟第二版比起來,少了幾千字頭,若加上類推簡體字頭,就更多了。

6 个赞

直接发做好的MDX,方便大家使用。

7 个赞

发现一个有意思的地方,「炮」(二)③「爆竹」条有「𤍤(⿰火章)」字,但没有字头

5 个赞

很难一蹴而就,逐步完善就好。

讨论多了,就会逐步了解大型汉语词典制作过程中的各种坑,也是好事

2 个赞

1.𠰳

同「丙」。19世纪末,受西方文化的影响,一些人论述问题时,爱用干支字作符号,代表某项内容。由于原有的干支字不够用,就另造了一套加口旁的干支字。犹如西方人在ABC之外,还有A’B’C’一样。梁启超《申论种族革命与政治革命之得失》:「如『甲乙丙』之后恒有『呷𠮙𠰳』,『甲乙丁』之后恒有『呷𠮙叮』,『甲丙丁』之后恒有『呷𠰳叮』。」

(三)jiǎ
同「甲」。参见「𠰳」。

𠮙

②同「乙」。参见「𠰳」。

「𠰳」的释义中明确提到「叮」,「叮」的释义却无「同『丁』」一条。

2.曾

于省吾《釋𬎿》:「𬎿即曾之初文。」

𬎿

同「留」。《宋元以來俗字譜》:「留」,《目連記》作「𬎿」。

「曾」的释义明确提出「𬎿」即曾,「𬎿」的释义却无提及。

1 个赞

“譌”是舊體,即康熙字體。
標準碼沒有相對的“訁為”。

為了兩個字條,這個字碼要重出(如果限制於標準碼)。兩個字形佔一個碼位。

兩個“𦣹”字形,也得重出字碼。不但標準碼不分辨,WFG當做同一個字所以私有區字也沒分配。

2 个赞

𩶚

同「䰽」。《中華大字典·魚部》:「䰽,本作𩶚。」

中华无此字(籍合网)。

1 个赞

我用的是random提供的數據,有“𩶚”字頭。釋義在“䰽”字條。(紙書:2839頁)

3 个赞

这种资料,多多益善,赞一个!

先汇集一切可以利用的资料,才能设法补全《汉语大字典》文本版。

做个交叉索引:

《汉语大字典》文字版(正查)

《汉语大字典》《汉语大词典》文字版(反查)

《汉语大字典》3种图像版

《汉语大字典》第2版在线检索

【Mastameta】漢語大字典(圖像版)

按:重做索引的新版。

3 个赞

《汉语大字典》第二版存在的问题.pdf (909.2 KB)
《汉语大字典》误字辨证.pdf (1.1 MB)
《汉语大字典》误字举证.pdf (1.0 MB)
备查。

4 个赞

要下载哪些文件,才能使用呢?偶比较笨

1 个赞