【阿彌陀佛】中華大字典[文字版/圖片版]2022.5.19更新

𣆚KX 𠕝KX
晟 𠕠KX
𣍓 𠕰KX

上面標 “KX” 的字,來自 康熙字典,也就是說因 康熙字典 而加入Unicode。不是日韓獨用的字,只不過日韓在某些字會更保留舊字體。
這種 Unicode 來歷的信息收在 UniHan 資訊庫,標在 IRG Source field。
例如 𠕠 字
https://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=𠕠
image

“GKX” 的 KX 代表 “康熙字典”;G 的意思是大陸提交的字形。

一般來說,如果 IRG Source 特別表某個字典(例如 康熙字典,大字典,大詞典,辭源),該字當字頭(像上面四個字)。偶爾該字只出現在釋文。也有些特別狀況,像大字典第一版的字形有問題,在第二版改變了,例如 𧃱、𧂘:

大字典第一版 提交了這個字形(而加入Unicode):
image

所以 IRG Source 是 “GHZ”(=大字典):

後來在第二版改成:
image

這個字形較接近為康熙字典(GKX)加的漢字:

總之,雙胞胎怎麼分辨,有時要看這個 Unicode 漢字的來源。

字头错误

释文
釋文:(1)買賣所之也。……
釋文:今之餹䬾曰~。見《廣韻》。
釋文:同蜂。見《篇海類編》。
釋文:……………………
釋文:~魁。大貌。見《集韻》。
釋文:(1)進趣也。从大从十……
釋文:寶俗字。見《正字通》。
𢑐 釋文:當俗字。
釋文:輜車旁推戶也。……
釋文:挑~也。亦借用剔。見《篇海》
釋文:擊馬也。見《說文》。……
釋文:案或字。見《集韻》。……
釋文:涕流皃。从水。𢿱省聲……
釋文:(1)~滃。大水皃……
釋文:姓也。……
釋文:(1)脈~也。見《說文》……
𩮱 釋文:◎本作𩯐。……
釋文:倦也。見《玉篇》…… 𠈻
[s] 𤔍 (见子集第72页,第75页又重出。)
釋文:心不平也。見《海篇》…… 𠐳
𠓳 釋文:…………………… 𠓴
𣆚 釋文:本作㡅…… 𠕝
釋文:飯匱也。見《集韻》…… 𠕠
𣍓 釋文:宬也。見廣韻。釋文:古㡅字。見集韻…… 𠕰

增加字头
,同佟。見川篇。
:同春字。见六书统
㳿:求於切音渠魚韻。宋魏之間。谓把為~挐。見《集韻》按方言作渠挐。
:居牙切,音嘉,麻韻。居伽切,音𨔗,歌韻。 (1)釋~牟尼佛號也。釋言能仁天竺~維衛國王之子。年十九出家。三十成佛。說法四十九載。乃於拘尸那城、娑羅雙樹閒、入涅槃。 (2)𨔣省字〔集韵〕𨔣。說文、𨔣互。令不得行也。或省。〔按𨔣互即梐枑。亦名行馬。玉篇互作牙。蓋形近而譌。〕 (3)通邂。〔太玄迎〕迎父~逅。〔注〕~逅。邂逅,解脱之貌也。

删除重复字头
字头:澦,删除重复解释一条。(第 1100 页、第 1094 页)
字头:鬪,删除重复一条。(第 2828 页第 9 字(【戌集】第167页)、第 3035 页(【补遗】第38页))

(呃,发现有个问题,|𤔍|(见子集第72页,第75页又重出。)|𠊻|,搞混了。)

7 个赞

我改過自己用的mdx沒留紀錄,但看書友們認真修改,值得提:這個電子版的異體字表有時跟釋義不合。較常見的問題是異體字表僅列字頭而漏了釋文提到的異體字。

也有A字條的表提到B字,但B字條沒提到A字。異體字表的格式也有異常。指的是protect 提供的電子版。(跟佛大版本的差距我不知道)

另外,有很多平面2的兼容字,異體字表當作不存在。包括權威字典收的兼容字字頭。這方面 葉典字海 的異體字表更全,但各有互補的作用。

現在又想起來,有幾百還是幾千字條,釋文有兩個版本,一長一短,默認顯示的是短版本,長版本被隱藏。短版本自然是重出內容。

5 个赞

字头错误

释文
𠛯 釋文:古制字。見集韻。 𠜔
𠢪 釋文:…… 𠟈
釋文:同年。見《字彙補》…… 𠦅
𠧵 釋文:獸也。見篇韻。 𠧯
𠂢 釋文:水邪流。見字彙補。 𠨸
𡘞 釋文:(1)𤳊屬……(2)臿也…… 𠫻
𠲿 釋文:鳥喙也。…… 𠲋
釋文:嘗俗字…… 𠹉
釋文:大聲也…… 𡃡
𡊓 𡊈
𡙐 釋文:肥也…… 𡙋
𡧆 釋文:古終字 𡦿
釋文:寢本字…… 𡫒寢
釋文:~嶷。不齊皃。…… 𡸟
𢮧 釋文:同畀。相付與之也。 𢮅
𢽘 釋文:古殺字。…… 𢽅
𢻚 釋文:弓硬貌。見字彙 𢾪
𣈩 釋文:終古字 𣊜
𣕹 釋文:…… 𣓉

新增字头
𡘞:释文:𠫻譌字。見《正字通》。
𡆶:釋文:同模。見《漢碑》。
𡼬:式荏切,音審,寢韻。釋文:山名。见《玉篇》
𣏡:釋文:~橘也。見《篇海》。

2 个赞

应该是的。幸好有众人之力,可以不断捉虫

赞同。尤其是OCR过来的文本问题较多的情况下,有那些图片还是重要的。

再加上也不是难事,不过那部分数据本身代码有点臃肿,导致拖慢查询速度,所以之前的改进版本就去掉了。

2 个赞

部分条目结尾处内容不完整:
【𢁺】志馮序。魯魚帝~。作此形。〕
【𣰆】府云。𣯚~五木香。〕
【𤗮】曰。𤗰~堰在舒城縣。~閘並同。元史作牐。〕
【𦓂】古文無此字。乃譌字也。〕
【幹】尙書。〔注〕~、與管同。
【𢘴】从卵。省作~。非。

字头误入:
【髼】〔𩭊
补【𩭊】 髷~。髮鬈貌。見〔類篇〕。〔詳髷字。〕

3 个赞

这个情况还有呢。

㻡:釋文:人名。〔史記王子。侯者年表〕牟平侯~〔注〕~音薛。〔按漢書作渫。〕
䅽:釋文:讀與馨同。~飪之邪。見〔字彙補引金匱要略。〕
淸:釋文:凊或字。《集韻》凊寒也。或作~。
𨣗:釋文:濁酒也。見《字彙》。〔按音義注同𣫈。正字通云譌字〕。
鰯:釋文(1)鰮魚。一名~魚。詳鰮字。(2)~鯨。屬于鯨類之無齒類。約長三四丈。腹部白。他部俱黑。頭上有疣狀之突起。脊鰭大。下顎與腹部之間具多數之縱皺。
乒:……~乓。聲也〔餘詳乓字〕。
傹:……也。〔注〕言其人可以氣吹之使仆。喻不足恃也。
嗎:……言辭也。
找:……補不足曰~。見《洪武正韻》。凡尋覓人物曰~。
歹:……字之反。見《說文長箋》。

另外还有一些释文位置错误的,有60+
截图未命名

4 个赞

1,修改部分字头。

释文
釋文:汁錯喉…… 𣢼
釋文:(1)參之轉聲……(2)~陽。…… 𣬛
釋文:水也。見《玉篇》。 𣴢
釋文:水朝宗于海也。…… 𣶃
𢑘 釋文:同魅。見《字彙補》。 𣼙
𤫕 釋文:玉名。見《五…… 𤫘
釋文:牛舌病。…… 𤵞
釋文:同暜 𤽽
釋文:〔與禾異〕。木之曲頭止不能上也 𥝌
釋文:飼也。見《集韻》。 𥞊
𥶖 釋文:竹生海邊。見海篇。 𥵲
𧂲 釋文:酒母也。見說文‧米部。 𥶶
釋文:(1)髮巾也…… 𦁡
𦒯 𦒇
𦰚 𦮮
𦫜 𦫟
𧏌 𧐡
釋文:姓也…… 𧔧
𧗝 釋文:向也…… 𧗢
釋文:大板也…… 𧠒
釋文:~言。脣急皃。 𧥛
釋文:言~。詳言字。 𧥜
𧥭 釋文:訊俗字 𧥬
釋文:䛁本字…… 𧧛
釋文:講本字…… 𧪸
釋文:䜈本字…… 𧭄
釋文:豊本字…… 𧯽
釋文:同豕…… 𧰬
釋文:同酈…… 𨟫
釋文:陋本字…… 𨹟
釋文:魴籒文…… 𩷸
𪀜
𪇂 𪄗
𪇠 𪅀
𪈓 𮭝
釋文:兜俗字。 𫥢
釋文:詀或字…… 𫍓
𦬣 釋文:艸名…… 𫇪
釋文:袜或字…… 𫃟

2,新增
𣣬 釋文:同資。見字彙補。
𣥑 釋文:歬譌字。正字通云。前本字。攷說文前作歬。不作~。故訂為譌字。
𣥭 釋文 :古戰字。見《集韻》。
𣻯 釋文 :潁譌字。【按《正字通》十二畫澃下云。潁字之譌。《說文》:𣻯水出潁川陽城乾山東。入淮。从水頃聲。豫州浸。實引《說文》𣻯字全文。《康熙字典》以為十一畫内缺~字。補入。謬矣。】
𥾟 釋文:綦字。見《類篇》。
𨀮 烏玄切音淵先韻 xuān yuān釋文:躓也。〔文選王延壽賦〕競爭飲而~馳。
𨋦 先伊切支韻。釋文:䡆輀也。見《五音篇海》。
𨗭 釋文:古遗字。
𨴟 釋文:同閦。
𮦟 釋文:同電。見《海篇》
𪄗 釋文:~𪅃。野鴨、見篇海。
𫡑 魚音切,音吟,侵韻。釋文:衆立也。從三人。見《說文》。
𫡑 披班切,音盼,平聲刪韻。釋文:同攀。〔揚雄反騷〕纍旣~傳說兮。〔師古注〕~、古攀字。
𫂬 釋文:篽或字。見《集韻》
𪖩 許六切音旭屋韻。䫆鼻也。見《字彙》。〔按舊注又引集韻女六切音肭。鼻出血也。與衄同。攷集韻女六切。衄。說文、鼻出血也。或从鼻。字形作𧗗。不作~。故不錄。〕

链接在上面84楼

3 个赞

页面在深蓝和tango上左右活动,显示不完全,麻烦您修正一下。

新增字是书上的吗?怎么没有找到呢?

当然是书上有的,我又不能凭空创造。
01
02

不改!
就几个div,想要它多大,你自己修改样式表。

2 个赞


有重复、异字

1 个赞

重复词条,前面我删除了一百多条,但是还经常碰到。
这些重复词条,大多是由于某些私字被随机替换造成的。

由于这个原因,某些字头可能出现一个字头十条词条九条重复。
涉及几百字头,重复词条没删干净是存在的。

謝謝修改留紀錄,我還沒機會仔細看。

要是我的話,我會先完成圖像版索引,再跟文字版比對。或是說,通過比對方式來完成圖像版索引。圖像版是基礎。
圖像版兩百多頁,索引問題多,核對不上,使得我懷疑是針對其他紙本版本。
原來的圖像版索引,也許來自國學大師網頁,可以參考那裡鏈接的圖像,確定是否跟我們手上的一樣。

我講的索引是保留字頭、頁碼、順次的關係,而不是把所有重出的字頭合併起來。

2 个赞

我是图像和文字版一起的。
文字版只是提取出来而已。

文字版有1000多字头是图像版没有的。。。这个真不好找。
图像版有400多是文字版没有的。这个倒是改完了。

另外,图像版有100多是兼容字做字头的,这些兼容字在MDICT和原书上一样,但是换到GD就差别很大。mdict没有对兼容字转换处理,GD就有转换。

这些兼容字,作不作字头,你怎么看?

我在考虑用兼容字作字头,然后结它加图片
巢(U+2f882)
01
02

GD作法等於一刀切。兼容字實際上有三類:


第一類:字形重複而棄用。平面 0 兼容區(U+F900-FAFF; 512 字碼),大約 70% 字是完全重複字形,應該棄用。(其他字形,大同小異,關鍵是這種 “小異” 不是字典一般會關注的異別,所以用不上。)

例如,豈 (F900)兼容字是淘汰字,因為完全重複 豈(8C48)標準字的字形。查 F900 時,適合跳到 8C48,畢竟是同一個字(形)。在這情況下,軟件或 mdx 提供跳轉是對的。

注意:平面0兼容區,其中12字,雖然在兼容區,Unicode 定為為標準字:﨎、﨏、﨑、﨓、﨔、﨟、﨡、﨣、﨤、﨧、﨨、﨩。這裡最常見的字頭是 “﨩”(FA29)。原則上,商業字型(font)應該支持。

平面0又有一群字,Unicode主張棄用,但還是適合用,而且mdx群眾用了很久了。例如:滋 xuán(FA99),收在漢語大字典、辭源、王力字典。字典分辨 滋 xuán(FA99)與 zī 滋(6ECB):字形、音義都不相同。Unicode主張棄用FA99,用 6ECB 替代,等於是把兩個字混成一個字!所以別管他是兼容字,基本道理是:與其用私有區字,寧可用兼容字。起碼,兼容字的 字形—字碼 關係是官方標準,是固定的。


第二類:字碼的字形是獨特的。 這類不要排擠,可以當做標準字一樣用。據我預算,平面2兼容區(U+2F800-2FA1F; 542 字碼)80% 是這類的。

你提的 巢(U+2F882)屬於這類。巢是巢的本字,字典既然分辨,就用 Unicode 分辨。在 Unicode Code Chart (跨區的規範字形表),2F882 與 5DE2 之間沒有任何重出的字形,分明是兩個不同字。所以如果你要的是 巢 字形,就應該用 2F882 來表現,這就是 Unicode Code Chart 的道理。


image

附言:給 2F882 字碼提交的 UTC-00136 字形,據說是按照大字典第一版。in any case,“UTC” 與 “T” 字形都繼承康熙字典字形。巢 也是說文小篆字形的隸定。

用兼容字才能分辨:滋 FA99、滋 6ECB、滋 2F90B。如果字典不分,兼容字就不必用。

說個玄奧的例子,說文:“成:从戊丁聲”。如果要表現這個 “丁” 部件,就用 2F8B2。
image
image

在個現代漢語字典,讓 2F8B2 跳到 6210 算了,但在說文裡,只有 2F8B2 才能表現 “从戊丁聲”。兩個字形大同小異,但大幅度的字典,像中華大字典,就在分辨這種所謂“小”異別,不得不利用兼容字。回到原來的話:與其用私有區字,寧可用兼容字。中華大字典電子版都用上私有區字,但又排擠兼容字,豈有此理!


第三類較特殊:嚴格來說,字形是重複的,但對某個地區或電腦環境來說,他當作補充。例如《通用规范汉字表》:
image

865C,一碼多形,在“簡體字”電腦字型會顯示 “G” 形;在“繁體字”環境會顯示 “T”:
image image

所以,任何一個電腦字型無法並陳 G 與 T(因為兩個佔一個字碼),所以兼容字可以用來當補充。

  • 在簡體字環境,“虜”的 G 形用標準字 865C 來表現;T 形用兼容字 虜(F936)來表現。
  • 在繁體字環境,“T” 形用 865C 表現;“G” 形用兼容字 虜(2F9B4)。

in short, these are for situational, localized use. 等於把 Unicode 地區化了,或是說,局限於一個地區的標準。這樣有點違背 Unicode 的旨意,本來應該是個跨區的國際標準。但這樣有點不得已,為了應付 “並陳” 的需求。並陳有別的方案,但用兼容字最簡單。


總之,第二類盡量用,而且大規模的字型(例如方正中華)幾乎都支持。第三類的,看字典標準,看電腦環境。

有時平面0的兼容字,還是適合使用,但要考慮字型是否支持。例如上述的 滋 xuán(FA99),中華字型缺,反而把這字形掛在其私有區 󶅩(F6169) – 私有的是沒準,兼容字起碼有固定的 字形—字碼 標準。

2 个赞

你的砖头不能查看了,求更新链接,谢谢!

方正中華 “㮝” 3B9D 的字形有問題,重複了 “㮝” 2F8E7 字形。
image

紙本的字形从 “⻏”。這是正字。說文:“从木郤聲。” 上面的篆形 image 明顯从 "邑⻏”。
《中華大字典》特別指出康熙从“卩”的康熙字形是錯的(1204頁):

也許方正的用意是要採用康熙字形,但排擠用兼容字 “㮝” 2F8E7,所以把此形掛在 3B9D。方正辭源的3B9D 也如此;其 2F8E7 是空白。無論如何,方正中華字形不符合 Unicode 標準:
image

又跟《中華大字典》的說法出衝突,用在這字典上是一錯再錯。

1 个赞

我收集的砖头:https://pan.baidu.com/s/1Vq0pvBa4OFcF7OI75mgRsw?pwd=qk8y
提取码:qk8y
(添砖加瓦 》砖头》中z華h大d字z典d)

链接失效了啊 再分享下啊 谢谢啊