【Mastameta】漢語大字典(圖文綜版)3.21

䩶(兩個字形佔同一個字碼)

筮(模擬單欄)

《漢語大字典》(2010) 第二版 九卷本

圖文綜版的使用:

  • 點擊字目、或字條右邊緣來展現圖像頁面。
  • 在頁面,點擊左右邊緣來翻頁;點擊中間來關閉頁面。
  • 窗口放大,則展現整頁圖像;縮窄,則模擬單欄模式。
  • 注意:不能讓軟件控制列圖寬度,否則CSS無效。
    MDict app:關掉“Settings: View: Resize images to fit in window”.
    Dict Tango:勾選 “詞典管理:編輯詳情:禁止自動調整圖片”。

文字版說明:
  • 9.23 升級到 Unicode 15.0:字頭 51 字;釋文 5 字。
  • [全息]數據很多問題,例如“鄌”字頭出現三次,但其中兩條實際上是“岙”﹑“嶴”。麻煩的是內容混亂交錯:A 釋文誤插入 B 字條,使 A 條遺失或殘缺,又使 B 字條亂插衍文。例如“𧚫”釋文混進“䘻”字條,“𧚫”字皆誤作“䘻”;“𦒜”﹑“翧”併成一條,“𦒜”字皆誤作“翧”;“𤴁”條重疊兩條等等。光修這個問題,就整理了六七百字條⸺分別字條,歸回釋文,訂補字頭⸺分出來的新字條起碼有 300,例如:𪏘﹑黁﹑𨹪﹑𩐃﹑熚﹑䆸﹑𧳳﹑𩘵﹑賰﹑𤗰。
  • 感謝 feiwu 新抓字條,我收納了一千條。又手工補了些字條和釋文;原來所漏的類推簡化字字條,批量增補。現在文字版總共有 57,966 條,增加了 2,650 多條。與完整圖像板相比,文字版仍缺 2,400 字條(其中 600 多字頭是標準字)。
  • 給詞目加了 9,800+ 跳轉。相關條不見得在復詞的第一字,例如:豚耳@𠭿,鞟鞟@韕,𦘴胍@胍。
  • 字頭中 31 字碼,在 Unicode 包含陸源、台源兩個規範字形,大字典兼收而分成兩條;兩個字形佔同一個字碼,因此字碼難免重出。用特製字型來分辨:龜﹑充﹑育﹑宂﹑𦥨﹑壳﹑犮﹑珊﹑跚﹑粣﹑䞈﹑䃣﹑蟡﹑儰﹑䈧﹑糨﹑摾﹑䩶﹑𤲸﹑𥾬﹑𥶽﹑𧔠﹑檨﹑㡛﹑㤺﹑㨰﹑㪌﹑𣙾﹑丽﹑𣯉﹑𦣹。(兩個“𦣹”實為同字,字典偏分成兩條。)
  • 20 字組,大字典不分,但 Unicode 有所分辨,因此在字目特別提供異體:夐﹑曶﹑壿﹑胊﹑朦﹑朏﹑脧﹑朌﹑䐠﹑朣﹑脼﹑朡﹑䏓﹑朧﹑胶﹑䏙﹑𦝲﹑䐋﹑肭﹑𣎛。
  • 原來引號(“”)前後兩半沒達到一對一的比例,說明紙本標點或漏或衍,我糾正了幾百處,然後把書證標籤化。Single quotes(‘’)仍不對稱,差一百筆,其格式有點曖昧,必須查資料來源才能準確整理,因此就擱著不動,反正不影響書證的認定。
  • 亂碼都解決了。2,000 多 “:sunny:” 符號,已經處理其五分之四。邊用邊改。
圖像板說明:
  • 索引更新到2021年Unicode 14.0版(等於把私有區字換成標準字),又經過幾輪校對,總共改了 2,400 字頭。
  • 字頭數:60,367。其中 1,837 字沒有 Unicode 編碼缺,而用私有區字代表。私有區字標朱色,可以用《部件檢索》查出來。
    字頭中25字碼,包含兩個Unicode規範字形,字典兼收而分成兩個字條,因此難免有29字碼重出,但用字型分辨。例如“龜”、“宂”、“㨰”、“䩶”,字典以台源字形為正體,以陸源字形為異體,兩個字形佔同一個字碼。
  • 頁眉索引字數:60,530。163 字頭有特別補充,第一字提供標準字,能正常使用,但其字形與紙本不合;第二字(前面標“〾”)提供私有區字,以增補準確字形。
  • 或體字跳轉:3,100。查不到某字而知道大字典沒收,這也有意義在内,所以跳轉加得較謹慎,也經過一輪削减:原則上字形相近的或體字才有跳轉,例如“𡠌@媲”、“𡤞@䶯”、“𬱈@𩓔”。簡化字跳轉:1,500:都是大字典沒收的簡體(包括《通用規範漢字表》的字)和歷來俗體,例如“劢@勱”、“桠@椏”、𬜯@䓣”、“𡞋@㜗”、“嘨@嘯”。

2022.6.7 (頁面圖像 1.2 GB) 1.mdd, 2.mdd

漢語大字典.zip (40 MB)

仍有零碎毛病,邊用邊改。

Unicode 標準字方面,文字版現在缺 716 條:
HZ 716-2470.txt (49.0 KB)

60 Likes

厲害了,大工程!

14 Likes

太牛了,多谢多谢。

13 Likes


下面大量空白区域,右侧的字没有了。
安卓欧路

5 Likes

你是不是打开了图片自适应调整?需要关掉。在手机上应当单栏显示。

3 Likes

楼主分享制作的几部作品都是精品中的精品,从中获益良多!

7 Likes

又一部鸿篇巨制!!!
Mastameta太厉害了!点个大大的赞!
非常感谢!

2 Likes

厉害啦,点赞,点赞!!

5 Likes

希望有人就IOS欧路端调整下格式,万分感激!

2 Likes

惊天动地的好作品啊呵呵不错不错真是神作也,本来对图片词典没啥兴趣的,但是Mastameta的几个词典的图片版质量不错清晰也小巧啊

3 Likes

发两枚图标,喜欢就拿去!
漢語大字典 (2010)(漢語大字典 圖像板)byMastameta220329
漢語大字典 (2010)(漢語大字典 圖像板)byMastameta2203294

2 Likes

诶,吹毛的又来了 :grin:

Mastameta 兄,今年是2022年了。
词典描述似乎设置了字体,以致于DictTango不能调用全局字体来显示。

上方的字头显示,小图标在字的上方了。Mdict PC 窗口足够窄也会和手机显示效果一样。
左右侧空白宽度不一,不知是否有意为之。

1 Like

mdict安卓系统,是正常的吗:

2 Likes

read my post at the top

3 Likes

词典描述显示:2021.3.30

5 Likes

頁眉索引,在大寬度(整頁)、中寬度(單欄)是正常的。但小寬度(手機)需要調理,I previously fiddled with it a little bit but couldn’t get it right, so just left it as is. Will deal with it at some point.

4 Likes

M大师,最好把此帖的标题改一个字: [漢語大字典 圖像板]
“板”改为“版”吧。

5 Likes

感谢制作,可以做一个汉语大词典图像版本吗,谢谢

4 Likes

大詞典圖像質量不良,不知道要手工切多少圖才能達到我要的效果。
主要問題是複詞不好處理,光一個複詞就可以有四五六個寫法,涉及到繁簡字、新舊體、Unicode異體等等問題,又有一作、或作,想起這個就覺得頭痛。辭源隨便弄弄,就有六萬複詞跳轉了,何況大詞典的幅度!我不敢碰,寧可等大詞典出新版。


比方說,我在清晰版查“一概”,反而跑到 010094 頁的“一㮣”詞條:
image

哈哈。“一概”到底在哪一頁呢,mdx索引沒有,你自己翻頁去找。而且這個詞有五個寫法:一槩U+69E9、一㮣 3BA3、一概 6982、一槪 69EA、一槪 2F8EA。(五個寫法…這種孔乙己腔的話我居然說出來了呵呵。)這例子都沒涉及到繁簡字問題哦。況且第一個字是固定的,要是每個字都能變…哈哈。三個字的複詞呢?四個字呢?the problem becomes exponentially more complicated.

9 Likes

期待Mastameta兄重制的辞源文字版!

3 Likes