《汉语大字典[全息]》11.2更新

2021.11.02
汉语大字典[全息]3.0.7z (12.3 MB)
扩G增补.txt (305.9 KB)
1.由于书局的自身限制,位于扩G的字头整体缺失。本次增补参考字统网及白云深处人家。
2.其他修订若干。

2021.10.16
本来不想发mdx的,因为实在没有作多少修改,不说达不到大家的预期,我自己的预期也是达不到的。不过既然阿弥陀佛大佬让发,那就发一个吧。
漢語大字典 [全息].mdx (12.3 MB)
dazidian.css (298 字节)
增补.txt (21.3 KB)
错简.txt (20.8 KB)
1.汉大有些字合并了,如「胶(肉)㬵(月)」,这样后一个字就没有字头,处理方式是增加「㬵(月)」字头注明『見「胶」(二)①』(此句用<fw></fw>标签包围),并链接到「胶(肉)」,而「胶(肉)」不变,包括释义内对「㬵(月)」的解释,仍用「胶(肉)」。
2.新旧字型(两种字型一个码位)处理方式:汉大兼收的,如「龜」,旧字型用〾分别;只收一个的,如「譌」,直接换成新字型。原则上不使用康熙部首、兼容字、私用区。
3.收集错简计71条,部分字未入U,注明「X页第x字」,未加入增补。部分字不知从何处阑入,注明「待考」。

《汉语大字典[全息]》
看了一下这个词典,文本应该是某书局
龜部缺了一批字,猜想可能是用了PUA,所以没抓到,在此补上,手打的
龜部「龜」字新旧字形兼收,所以旧字形用〾表示。
另有四五个字没入U,没加
龜部增补.txt (12.7 KB)

10 Likes

多谢完善! :heart: :heart:

1 Like

謝謝!我第一次看這個資料,覺得很驚訝漏了那麼多‘龜’部的字條。

標準字方面,還缺:𪚦、𪚧、𪚫、𪚱、𪚽、𪛃、𪛄

私有區字形方面,還缺:(全宋體)󰱗、󰱘、󰱙、󰱚、󰱛、󰱜

龜字很麻煩,新舊字體佔同一個碼位。不用死字或私有區字來區分,就得讓字頭字碼重出。沒有任何辦法是好的。

[全息] 數據有幾百字條,內容交錯混亂。例如“倚”字條,插進“俹”字條的釋義。也有一百多字條錯誤合併,應該分開,也要補充漏掉的字頭。如果跟紙書對比,應當還有別的事。
[全息] 有編碼的限制,我記得跟第二版比起來,少了幾千字頭,若加上類推簡體字頭,就更多了。

4 Likes

直接发做好的MDX,方便大家使用。

3 Likes

发现一个有意思的地方,「炮」(二)③「爆竹」条有「𤍤(⿰火章)」字,但没有字头

5 Likes

很难一蹴而就,逐步完善就好。

讨论多了,就会逐步了解大型汉语词典制作过程中的各种坑,也是好事

1 Like

1.𠰳

同「丙」。19世纪末,受西方文化的影响,一些人论述问题时,爱用干支字作符号,代表某项内容。由于原有的干支字不够用,就另造了一套加口旁的干支字。犹如西方人在ABC之外,还有A’B’C’一样。梁启超《申论种族革命与政治革命之得失》:「如『甲乙丙』之后恒有『呷𠮙𠰳』,『甲乙丁』之后恒有『呷𠮙叮』,『甲丙丁』之后恒有『呷𠰳叮』。」

(三)jiǎ
同「甲」。参见「𠰳」。

𠮙

②同「乙」。参见「𠰳」。

「𠰳」的释义中明确提到「叮」,「叮」的释义却无「同『丁』」一条。

2.曾

于省吾《釋𬎿》:「𬎿即曾之初文。」

𬎿

同「留」。《宋元以來俗字譜》:「留」,《目連記》作「𬎿」。

「曾」的释义明确提出「𬎿」即曾,「𬎿」的释义却无提及。

1 Like

“譌”是舊體,即康熙字體。
標準碼沒有相對的“訁為”。

為了兩個字條,這個字碼要重出(如果限制於標準碼)。兩個字形佔一個碼位。

兩個“𦣹”字形,也得重出字碼。不但標準碼不分辨,WFG當做同一個字所以私有區字也沒分配。

𩶚

同「䰽」。《中華大字典·魚部》:「䰽,本作𩶚。」

中华无此字(籍合网)。

我用的是random提供的數據,有“𩶚”字頭。釋義在“䰽”字條。(紙書:2839頁)

2 Likes

这种资料,多多益善,赞一个!

先汇集一切可以利用的资料,才能设法补全《汉语大字典》文本版。

做个交叉索引:

《汉语大字典》文字版(正查)

《汉语大字典》《汉语大词典》文字版(反查)

《汉语大字典》3种图像版

《汉语大字典》第2版在线检索

【Mastameta】漢語大字典(圖像版)

按:重做索引的新版。

2 Likes

在目前的排版上每条释义引用的句子都挤在一起,显得很杂乱,而汉语大词典文字版把每条引用换行排版阅读效果就好了很多,请问有没有哪位大佬能把排版修改一下,非常感谢


1 Like