【Mastameta】說文解字(綜合版)7.3更新

老大,就是18日版本的“段注本”的格式和“小徐本”、“大徐本”的不同
字头没动,只是把细明体改成woff格式,体积更小。

@font-face {font-family:‘MingLiU’; src: url(‘mingliu.woff’) format(‘woff’)}
@font-face {font-family:‘MingLiU-Ext’; src: url(‘mingliub_01.woff’) format(‘woff’)}
@font-face {font-family:‘MingLiU-Ext’; src: url(‘mingliub_02.woff’) format(‘woff’)}

1 Like

關鍵是之前數據有個用正則的失誤,所以我從一個完整版本再做了一遍;有的標籤來不及修,現在應當正常了。
關於細明/全宋,我打算只包所用的字,應當總共只佔5MB左右。有點麻煩,等到補完“段注本”的“※”符號再搞那個。那只不過給手機用的,PC本身有細明,所以這事不急。

“※”符號在這些字條已經換成字:𠐱、上、下、僾、凡、君、旡、卵、彳

2 Likes

祝楼主早日完成。我这可以在手机上临时用着,不至于出现很多方块。
我真傻,下的是12点那个版本,还以为楼主一直没改……

m兄,最新版本在欧路词典仍然显示不出您漂亮的排版。

1 Like

看來歐路不支持豎排 vertical writing mode。
小題豎排在圖像邊,這樣最省空間;小題橫排就用太多高度,因為要換行,而且文字都堆在一起,小題跟小題之間又得分配更多隔離空間…
要用別的解決方式有點折騰。and browser support for vertical writing mode is quite finicky to begin with, so I don’t want to tinker with something that already works. 反正這是歐路的限制,可以跟他們反饋。(MDict是利用Internet Explorer的html rendering,不用自己去處理這方面。)

2 Likes

請求再發 sxingbai 抓的[ [北师大说文解字]。(我以為我抓了,但找不到。)我想把章太炎說文解字授課筆記的內容灌進來。

“解釋版”的層次我打算刪掉,像oald說的,跟說文沒有直接關係,而且毛病多。

3 Likes

我保存的,请楼本查收。链接:https://pan.baidu.com/s/17gccNP3Zg-pMVPuJovSd5A
提取码:uj5m
–来自百度网盘超级会员V6的分享

2 Likes

为大徐本加上纸本图像(中华书局2013年)可好?百度网盘-链接不存在
提取码:c07w

4 Likes

多謝!看來章太炎說文解字授課筆記有3827條。

1 Like

那本的注解沒有mdx全,沒有“蔣注”。例如95頁,“𠧟”字條。

目前mdx大徐本“𠧟”字條的“蔣注”遺漏兩個字,我正在找這個。

請問有沒有帶“蔣注”的善本?知不知書名?我樂意加上去,但不去定要採用哪本書。

楼主好,我不算内行,怀疑这里“蒋注”是今人加的,不存在带蒋注的善本,但我不知道“蒋”指谁。论坛里更了解的先生能否指教下?我也再查查看

1 Like

蒋马门整理电子本时所加?

2 Likes

本字典的原始數據主要取自白雲深處人家 蔣門馬先生相贈的《說文解字》綜合檢索系統離線版,經過修整、訂正,並合併了若干其他來源的資料而來。寧波 蔣門馬先生耗費了多年的時間與精力,收集整理成極為完整的說文解字資料,承蒙相贈,並在製作的過程中多有說明、指正,不勝感激。

綜合檢索系統的原始數據有不少瑕疵,像陳昌治本的頁碼,是從四拼版頁碼換算而來,所以只有奇數沒有偶數。通訓定聲、說文義證頁碼也多有錯誤。經 suns99 兄出手相助,修復了陳昌治本頁碼,並增補了《說文解字校箋》、《說文解字注》(許惟賢本)的頁碼。《繫傳》文字也多有錯漏,原稿多處「云」誤作「雲」、「咸」誤作「鹹」,已人工粗略排查一遍。而《段注》文本文句缺漏甚多,不甚理想,後來找到志攀兄建立的 github,大規模修整後,取代了缺漏的段注文本。

整部字典以三本主要的《說文解字》著作——大徐本、小徐本(《說文解字繫傳》)、段注本(《說文解字注》),並立為經,而以其他的輔助資料——書籍頁碼、相關附註為緯,交織出一個綿密的參考網絡。每一次查詢都能看到這三個版本的異同,如果備有各版書影還能快速參閱各種刻本原貌,段玉裁的《說文解字注》、朱駿聲的《說文通訓定聲》、桂馥的《說文解字義證》、王筠的《說文句讀》,清代「說文四大家」的頁碼索引一應具全,對於《說文解字》的研究,這是一個很方便的查考工具。

3 Likes

謝謝指點。在 http://www.homeinmists.com/shuowen/find.html 網頁翻了幾本圖像,還沒找到“蔣注”的來源。

但“𠧟”字條的遺漏字終於能補上去了,是Unicode 2020年的G擴展區字:𰀾。

1 Like

如果是 白雲深處人家网站主人 蔣門馬先生 加上去的,那是不会出现在图像扫描本里头的

2 Likes

“蒋注”在网站上用“备注”方式显示,应该就是蒋先生随字做了一些考证吧,大概没有相应出版物

3 Likes

正解…… :+1: :smiley:

11-21更新

每次Unicode添加新的漢字,WFG全宋體中的一批私有區字形就升級到標準字碼,然後舊的私有區碼位就被消除,或換成另外字形。因為WFG說文版沒有同時跟他的全宋體更新,被消除的私有區字就出問題:有的顯不出來;大多更嚴重,會顯出錯字。

比方說,“𢄢”字條,在最新的全宋體,楷書字頭是空白:
image

我把私有區字改成標準字:
image

“造”字條,私有區字變成錯字了:
image

改成標準字:
image

核心數據已更新到最新Unicode。
主mdd也包了需要用的字型。

修改記錄:

  • 𢄢字條:私有區 ➔標準字“𰏞”。加“𰏞”為異體字。
  • 涶字條:私有區󵠵➔標準字“𰝇”。把“𰝇”當字頭”;“涶”當異體。加了跳轉。
  • 唾字條:加“𰝇”當字頭”;把“涶”當異體字。
  • 占字條:私有區󶌃➔標準字“𰉏”。加“𰉏”為關聯字;加了跳轉。
  • 鼔字條:私有區󶓣➔標準字“𰚃”。加“𰚃”為關聯字;加了跳轉。
  • 隓字條:私有區󶏜➔標準字“𱀋”。加“𱀋”為關聯字;加了跳轉。
  • 𠧟字條:私有區󶏫➔標準字“𰀾”。加“𰀾”為關聯字;加了跳轉。
  • 并字條:私有區󰗜➔標準字“𰏤”。加“𰏤”為關聯字;加了跳轉。
  • 舜字條:私有區󵁴➔標準字“𰰊”。加“𰰊”為關聯字;加了跳轉。
  • 造字條:私有區󵃶➔標準字“𰍟”。加“𰍟”為關聯字;加了跳轉。
  • 婚字條:私有區󵄋➔標準字“𰘕”。加“𰘕”為關聯字;加了跳轉。
  • 災字條:私有區󵇜➔標準字“𰝸”。加“𰝸”為關聯字;加了跳轉。
  • 盾字條:私有區󶈓➔標準字“𰒦”。
  • 馬字條:私有區󰕑➔標準字“𰀪”。
4 Likes

支持更新。

中文字符码位一致恐怕是个永远的难题。原因是各种各样的字形太多了。如果有个信息实时互通的平台,也许可以减少类似问题。

《說文》里头不少非规则的字形(象形文字)恐怕就没有包含在下面这个标准中。当然有了标准可以解决99%以上的问题,是件好事。

卻是。處理漢字mdx,尤其是古漢語字典,太多難題在內。我作英英字典時,好輕鬆哦,選字型只講美觀而已哈哈,什麼都不用多想。
想起來有點可怕:自從Unicode 13.0(2020年)出來,所有用上全宋體私有區字的mdx都有可能有變形的問題。