䩶(兩個字形佔同一個字碼)
筮(模擬單欄)
《漢語大字典》(2010) 第二版 九卷本
圖文綜版的使用:
- 點擊字目、或字條右邊緣來展現圖像頁面。
- 在頁面,點擊左右邊緣來翻頁;點擊中間來關閉頁面。
- 窗口放大,則展現整頁圖像;縮窄,則模擬單欄模式。
- 注意:不能讓軟件控制列圖寬度,否則CSS無效。
MDict app:關掉“Settings: View: Resize images to fit in window”.
Dict Tango:勾選 “詞典管理:編輯詳情:禁止自動調整圖片”。
文字版說明:
- 9.23 升級到 Unicode 15.0:字頭 51 字;釋文 5 字。
- [全息]數據很多問題,例如“鄌”字頭出現三次,但其中兩條實際上是“岙”﹑“嶴”。麻煩的是內容混亂交錯:A 釋文誤插入 B 字條,使 A 條遺失或殘缺,又使 B 字條亂插衍文。例如“𧚫”釋文混進“䘻”字條,“𧚫”字皆誤作“䘻”;“𦒜”﹑“翧”併成一條,“𦒜”字皆誤作“翧”;“𤴁”條重疊兩條等等。光修這個問題,就整理了六七百字條⸺分別字條,歸回釋文,訂補字頭⸺分出來的新字條起碼有 300,例如:𪏘﹑黁﹑𨹪﹑𩐃﹑熚﹑䆸﹑𧳳﹑𩘵﹑賰﹑𤗰。
- 感謝 feiwu 新抓字條,我收納了一千條。又手工補了些字條和釋文;原來所漏的類推簡化字字條,批量增補。現在文字版總共有 57,966 條,增加了 2,650 多條。與完整圖像板相比,文字版仍缺 2,400 字條(其中 600 多字頭是標準字)。
- 給詞目加了 9,800+ 跳轉。相關條不見得在復詞的第一字,例如:豚耳@𠭿,鞟鞟@韕,𦘴胍@胍。
- 字頭中 31 字碼,在 Unicode 包含陸源、台源兩個規範字形,大字典兼收而分成兩條;兩個字形佔同一個字碼,因此字碼難免重出。用特製字型來分辨:龜﹑充﹑育﹑宂﹑𦥨﹑壳﹑犮﹑珊﹑跚﹑粣﹑䞈﹑䃣﹑蟡﹑儰﹑䈧﹑糨﹑摾﹑䩶﹑𤲸﹑𥾬﹑𥶽﹑𧔠﹑檨﹑㡛﹑㤺﹑㨰﹑㪌﹑𣙾﹑丽﹑𣯉﹑𦣹。(兩個“𦣹”實為同字,字典偏分成兩條。)
- 20 字組,大字典不分,但 Unicode 有所分辨,因此在字目特別提供異體:夐﹑曶﹑壿﹑胊﹑朦﹑朏﹑脧﹑朌﹑䐠﹑朣﹑脼﹑朡﹑䏓﹑朧﹑胶﹑䏙﹑𦝲﹑䐋﹑肭﹑𣎛。
- 原來引號(“”)前後兩半沒達到一對一的比例,說明紙本標點或漏或衍,我糾正了幾百處,然後把書證標籤化。Single quotes(‘’)仍不對稱,差一百筆,其格式有點曖昧,必須查資料來源才能準確整理,因此就擱著不動,反正不影響書證的認定。
- 亂碼都解決了。2,000 多 “
” 符號,已經處理其五分之四。邊用邊改。
圖像板說明:
- 索引更新到2021年Unicode 14.0版(等於把私有區字換成標準字),又經過幾輪校對,總共改了 2,400 字頭。
- 字頭數:60,367。其中 1,837 字沒有 Unicode 編碼缺,而用私有區字代表。私有區字標朱色,可以用《部件檢索》查出來。
字頭中25字碼,包含兩個Unicode規範字形,字典兼收而分成兩個字條,因此難免有29字碼重出,但用字型分辨。例如“龜”、“宂”、“㨰”、“䩶”,字典以台源字形為正體,以陸源字形為異體,兩個字形佔同一個字碼。 - 頁眉索引字數:60,530。163 字頭有特別補充,第一字提供標準字,能正常使用,但其字形與紙本不合;第二字(前面標“〾”)提供私有區字,以增補準確字形。
- 或體字跳轉:3,100。查不到某字而知道大字典沒收,這也有意義在内,所以跳轉加得較謹慎,也經過一輪削减:原則上字形相近的或體字才有跳轉,例如“𡠌@媲”、“𡤞@䶯”、“𬱈@𩓔”。簡化字跳轉:1,500:都是大字典沒收的簡體(包括《通用規範漢字表》的字)和歷來俗體,例如“劢@勱”、“桠@椏”、𬜯@䓣”、“𡞋@㜗”、“嘨@嘯”。
2022.6.7 (頁面圖像 1.2 GB) 1.mdd, 2.mdd
仍有零碎毛病,邊用邊改。
Unicode 標準字方面,文字版現在缺 716 條:
HZ 716-2470.txt (49.0 KB)