【阿彌陀佛】古代汉语词典2[商务]文字版2022.5.17更新

我對這個工程沒什麼特別主意,只是隨便聊聊。
Dict Tango呢,沒有PC版,所以不管它多好我也不會常用。

2 Likes

没有 PC 版确实是个遗憾。

1 Like

谢谢大师制作分享。

这说明如果有个类wiki网页的版本供讨论、勘误、记录,就省事很多。可惜各种条件限制很难实现

1 Like

文字版數據,字頭標繁體,但詞頭不標。這是嚴重問題,例如:
image

應當這樣分辨:
image

不同繁體詞集中於一個簡體寫法:历数﹑系縻﹑台端﹑后帝﹑后门﹑向明﹑向服﹑沄沄﹑郁伊﹑郁郁。冬冬﹑冲冲﹑回翔﹑卷卷﹑涂巷﹑蒙昧﹑蒙蒙。

上面案子較明顯,我修了,但到處都是這個缺陷,無法人工修理。相關詞單,可以作,但解決不了上述毛病。

5 Likes

這的確是個大問題。簡化字之殤!原紙書也沒標出,是個巨大的遺憾。這部分一音多義詞APP全部沒有,全靠人工與紙書校對的。

3 Likes

2022.9.7
2022.5.2
古代汉语词典2 (2014).zip (7 MB)

  • 加了另一種詞單叫“關聯詞”。例如“槎枿”不歸於“枿”的“相關詞”因為“枿”沒有字條,但“枿”是“蘖”的異體字,所以“槎枿”列於“蘖”的關聯詞。
    image
    “關聯詞”不用“~”符號,因為它並不是字頭本身。。
    這類 出現在詞頭 但自己沒有字條的異體字,有36:
    㚟、蠵、阸、迆、蹏、緥、臝、袵、虵、虯、枿、矇、葅、穅、稾、眥、肬、疎、觝、汙、獘、櫫、慤、怳、廩、么、㟼、崯、嵒、砦、㜸、阬、啕、恡、捲、懃
  • 加了“關聯詞”,例如“槎枿”不歸於“枿”的“相關詞”因為“枿”沒有字條,但“枿”是“蘖”的異體字,所以“槎枿”列於“蘖”的“關聯詞”。關聯詞不用“~”符號,因為字不是主字頭本身。
  • 文本應當完善了,增补了:襂﹑冲1[沖]﹑今﹑菀﹑𬊤﹑𬊤赫﹑台2[臺]﹑䡶𫐐盖﹑䱍䲛﹑培𪣻﹑𫘝𫘨﹑𫘦𬳿﹑𬳵騃﹑晧晧﹑晧旰。
  • 4.12版有27私有區字,出現364次;改成標準字,又增補了“𡬶”的異體,現在私有區字有6個,出現10次。其字碼也換了,能跟《部件檢索》通用。私有區字原來用黑體,換成宋體,內嵌在MDD。
  • 字條裡的音項換行;只有字項(字體不同)才用橫線分段。注意:字條合併的字體項,次序經常有誤,我順手修了幾十個,但電子版本來就沒整理。(簡繁字,理應字排在下,本字排在上。)
  • 作了相關詞單,分成“詞頭”組(字頭在首位)和“相關詞”組(字頭在尾位或中間)。“詞頭”按照紙本順序排次(即拼音順序),列於核對的字項(不能詳細得歸於核對的音項)。電子版不特別分字項,所以必須人工分組和歸項。電子版改變的詞頭都歸新項,例如紙本“寮佐”,電子版改成“僚佐”,今歸“僚”字。
  • “相關詞”的排法:短詞先於長詞,尾位先於中位,第二字位先於第三,然後按照紙本詞頭頁碼來排次。“相關詞”皆列在字條最下面,因為難以判斷該歸何項。
  • 詞典的字頭標繁體,但詞頭不標,通常也不分字項(字1,字2)。例如“曆數”、“歷數”都合併於“历数”詞條,雖然是不同詞。我修了較明顯的案子,例如:历数﹑系縻﹑台端﹑后帝﹑后门﹑向明﹑向服﹑沄沄﹑郁伊﹑郁郁。冬冬﹑冲冲﹑回翔﹑卷卷﹑涂巷﹑蒙昧﹑蒙蒙。
  • 為了方便追究字體、字義,詞頭每字都加了鏈接。
  • 釋文中,去掉了2,000多鏈接,因為目的地就是本條。又去掉了500個鏈接,因為詞典沒收該字、該詞。
  • 刪了重出內容:㹶、批、滋、示、纽、金、襂、皓旰、皓皓、恍惚、疮痍、葱茏、蟾蜍。
編輯記錄:
  • 爻:“—”是阳爻→“⚊”是阳爻
  • 忄拜→𫺨
  • 璊→𫞩
  • 蝀→𬟽
  • 諲→𬤇
  • 鐍→𫔎
  • 顗→𫖮
  • 膢→𦝼
  • 貙→䝙
  • 貙膢→䝙𦝼
  • 纁→𫄸
  • 玄纁→玄𫄸
  • 玓瓅→玓𬍛
  • 謥詷→謥𫍣
  • 嗀→嗀
  • PUA→⺋
  • PUA→⺌
  • PUA→⺗
  • PUA→龵
  • PUA→𤴔
  • PUA→𥫗
  • PUA→⺶
  • PUA→⺷
  • PUA→𧾷
  • PUA→龺
  • PUA→𫲕
  • PUA→𬳩
  • PUA→𤜂
  • PUA→𥜽
  • PUA→𬡵
  • PUA→𮩴
  • PUA→懶
  • PUA→壳
  • PUA→椔
  • PUA→FSung-PUA󱃹
  • PUA→FSung-PUA󰚗
  • PUA→FSung-PUA󺜱
  • PUA→FSung-PUA󰶤。
  • PUA→T-source搢
  • 冗[PUA、宂]→[T-source宂、G-source宂]
  • 壳[壳]→G-source壳[T-source壳]
  • 犦[犦]→𤜌
  • 灊[灊]→[灊]
  • 寻[𡬶、𡬶]→[𡬶、FSung-PUA󴰉]

“心”的相關詞:
image

12 Likes

M大辛苦了!
css中引用的字体从哪里下载?没那些字体的话有些异体字显示不出来

3 Likes

辛苦了,感謝完善,功德無量!

1 Like

缺少的詞條重抓了一下,“今”原圖片版𣺘了,還有的,如 沖、台2[臺]、燀,【𬊤赫】APP也沒有。手動補上的。已與圖片校對,你可再看一下。

补词条4-19.txt (5.8 KB)

這個字,顯示有問題。。。私有字,不知有無類似的顯示問題,可再檢查一下
image

3 Likes

暂时用下面的文件覆盖进M大的文件夹,都不要改名,等待M大的更新
古代汉语词典2.1.mdd (228.3 KB)
GH2.css (2.0 KB)

2 Likes

字型方面,自己選用一個,例如中華、開心宋。
CSS指定是全宋體(就是部件檢索的字型),只不過因為它全,我不用想太多,方便編輯。能夠顯示所有的字就夠了,為了這個詞典不用太講究我覺得。

image
请问css指定的这些字体在哪里?

2 Likes

在mdd里面。

哦,看mdd那么小,还以为里面包含的不是字体文件

2 Likes

更新了mdx(5PM)。文本應當完善了。謝謝佛大。

字條合併了內容,字項次序經常有誤,原則上可以用正則查出來,但整理要很費工,不值得。就做到這裡,能用。——我本來只要加個 相關詞單,後來發現要先作這個那個才能好好處理,比我想象的複雜哈哈。

5 Likes

關於 𬌾 chuò 字,能顯示的字型:開心宋(KS)、中華書局(ZH)、全宋體(FS)。
這字 2015 年才加入 Unicode,支持度自然較低。

而且看 Unicode 信息,這字原來是為了這個詞典而加入字集!

image

1 Like

感谢兄台完善!辛苦了!

懶懶,椔椔,灊灊,𤜂

这四组后一个字能否也放入mdd中,它们和前一个字在大多数字体中都长得一样。比如微软雅黑、小米兰亭等。
全宋体和中华宋显示效果:
image

“搢”字条,我这里显示不正确。
image

IMG_20220419_151456

image

2 Likes

改了。
image

搢 字,一碼多形,若單展現一個就罷了,但若要並陳字碼的兩個字形—要嘛用私有區字,要嘛用兼容字、要嘛挪動字碼等等方式。我個人只有不得已才用私有區字。

對 Unicode 來講,兩個字形是同一個字,所以不分配兩個字碼。

一碼多形和並陳需求,這麻煩,不用私有區字就用特製字型。

2 Likes

Screenshot_20220419154038
阿弥陀佛版可以显示出来,但您的显示不出来,已经把开心宋体设为全局显示字体了,没有用

1 Like

私有區字,必須內嵌在MDD,標準字嘛,自己選用字型。你可以用原版的 GH2hei 黑體,如果不介意黑體、宋體混合。