feiwu
1
9.14
新增扩H汉字。
2021.11.02
扩G增补.txt (305.9 KB)
1.由于书局的自身限制,位于扩G的字头整体缺失。本次增补参考字统网及白云深处人家。
2.其他修订若干。
2021.10.16
本来不想发mdx的,因为实在没有作多少修改,不说达不到大家的预期,我自己的预期也是达不到的。不过既然阿弥陀佛大佬让发,那就发一个吧。
1.汉大有些字合并了,如「胶(肉)㬵(月)」,这样后一个字就没有字头,处理方式是增加「㬵(月)」字头注明『見「胶」(二)①』(此句用<fw></fw>
标签包围),并链接到「胶(肉)」,而「胶(肉)」不变,包括释义内对「㬵(月)」的解释,仍用「胶(肉)」。
2.新旧字型(两种字型一个码位)处理方式:汉大兼收的,如「龜」,旧字型用〾分别;只收一个的,如「譌」,直接换成新字型。原则上不使用康熙部首、兼容字、私用区。
3.收集错简计71条,部分字未入U,注明「X页第x字」,未加入增补。部分字不知从何处阑入,注明「待考」。
《汉语大字典[全息]》
看了一下这个词典,文本应该是某书局的
龜部缺了一批字,猜想可能是用了PUA,所以没抓到,在此补上,手打的
龜部「龜」字新旧字形兼收,所以旧字形用〾表示。
另有四五个字没入U,没加
龜部增补.txt (12.7 KB)
10 个赞
謝謝!我第一次看這個資料,覺得很驚訝漏了那麼多‘龜’部的字條。
標準字方面,還缺:𪚦、𪚧、𪚫、𪚱、𪚽、𪛃、𪛄
私有區字形方面,還缺:(全宋體)、、、、、
龜字很麻煩,新舊字體佔同一個碼位。不用死字或私有區字來區分,就得讓字頭字碼重出。沒有任何辦法是好的。
[全息] 數據有幾百字條,內容交錯混亂。例如“倚”字條,插進“俹”字條的釋義。也有一百多字條錯誤合併,應該分開,也要補充漏掉的字頭。如果跟紙書對比,應當還有別的事。
[全息] 有編碼的限制,我記得跟第二版比起來,少了幾千字頭,若加上類推簡體字頭,就更多了。
6 个赞
feiwu
5
发现一个有意思的地方,「炮」(二)③「爆竹」条有「𤍤(⿰火章)」字,但没有字头
5 个赞
很难一蹴而就,逐步完善就好。
讨论多了,就会逐步了解大型汉语词典制作过程中的各种坑,也是好事
2 个赞
feiwu
7
1.𠰳
同「丙」。19世纪末,受西方文化的影响,一些人论述问题时,爱用干支字作符号,代表某项内容。由于原有的干支字不够用,就另造了一套加口旁的干支字。犹如西方人在ABC之外,还有A’B’C’一样。梁启超《申论种族革命与政治革命之得失》:「如『甲乙丙』之后恒有『呷𠮙𠰳』,『甲乙丁』之后恒有『呷𠮙叮』,『甲丙丁』之后恒有『呷𠰳叮』。」
呷
(三)jiǎ
同「甲」。参见「𠰳」。
𠮙
②同「乙」。参见「𠰳」。
「𠰳」的释义中明确提到「叮」,「叮」的释义却无「同『丁』」一条。
2.曾
于省吾《釋𬎿》:「𬎿即曾之初文。」
𬎿
同「留」。《宋元以來俗字譜》:「留」,《目連記》作「𬎿」。
「曾」的释义明确提出「𬎿」即曾,「𬎿」的释义却无提及。
1 个赞
“譌”是舊體,即康熙字體。
標準碼沒有相對的“訁為”。
為了兩個字條,這個字碼要重出(如果限制於標準碼)。兩個字形佔一個碼位。
兩個“𦣹”字形,也得重出字碼。不但標準碼不分辨,WFG當做同一個字所以私有區字也沒分配。
2 个赞
我用的是random提供的數據,有“𩶚”字頭。釋義在“䰽”字條。(紙書:2839頁)
3 个赞
这种资料,多多益善,赞一个!
先汇集一切可以利用的资料,才能设法补全《汉语大字典》文本版。
做个交叉索引:
《汉语大字典》文字版(正查)
《汉语大字典》《汉语大词典》文字版(反查)
《汉语大字典》3种图像版
《汉语大字典》第2版在线检索
【Mastameta】漢語大字典(圖像版)
按:重做索引的新版。
3 个赞
feiwu
14
4 个赞