【Mastameta】說文解字(綜合版)11-30更新

我保存的,请楼本查收。链接:百度网盘 请输入提取码
提取码:uj5m
–来自百度网盘超级会员V6的分享

2 Likes

为大徐本加上纸本图像(中华书局2013年)可好?百度网盘 请输入提取码
提取码:c07w

1 Like

多謝!看來章太炎說文解字授課筆記有3827條。

那本的注解沒有mdx全,沒有“蔣注”。例如95頁,“𠧟”字條。

目前mdx大徐本“𠧟”字條的“蔣注”遺漏兩個字,我正在找這個。

請問有沒有帶“蔣注”的善本?知不知書名?我樂意加上去,但不去定要採用哪本書。

楼主好,我不算内行,怀疑这里“蒋注”是今人加的,不存在带蒋注的善本,但我不知道“蒋”指谁。论坛里更了解的先生能否指教下?我也再查查看

1 Like

蒋马门整理电子本时所加?

本字典的原始數據主要取自白雲深處人家 蔣門馬先生相贈的《說文解字》綜合檢索系統離線版,經過修整、訂正,並合併了若干其他來源的資料而來。寧波 蔣門馬先生耗費了多年的時間與精力,收集整理成極為完整的說文解字資料,承蒙相贈,並在製作的過程中多有說明、指正,不勝感激。

綜合檢索系統的原始數據有不少瑕疵,像陳昌治本的頁碼,是從四拼版頁碼換算而來,所以只有奇數沒有偶數。通訓定聲、說文義證頁碼也多有錯誤。經 suns99 兄出手相助,修復了陳昌治本頁碼,並增補了《說文解字校箋》、《說文解字注》(許惟賢本)的頁碼。《繫傳》文字也多有錯漏,原稿多處「云」誤作「雲」、「咸」誤作「鹹」,已人工粗略排查一遍。而《段注》文本文句缺漏甚多,不甚理想,後來找到志攀兄建立的 github,大規模修整後,取代了缺漏的段注文本。

整部字典以三本主要的《說文解字》著作——大徐本、小徐本(《說文解字繫傳》)、段注本(《說文解字注》),並立為經,而以其他的輔助資料——書籍頁碼、相關附註為緯,交織出一個綿密的參考網絡。每一次查詢都能看到這三個版本的異同,如果備有各版書影還能快速參閱各種刻本原貌,段玉裁的《說文解字注》、朱駿聲的《說文通訓定聲》、桂馥的《說文解字義證》、王筠的《說文句讀》,清代「說文四大家」的頁碼索引一應具全,對於《說文解字》的研究,這是一個很方便的查考工具。

3 Likes

謝謝指點。在 說文解字圖像查閱 逍遙子製作 網頁翻了幾本圖像,還沒找到“蔣注”的來源。

但“𠧟”字條的遺漏字終於能補上去了,是Unicode 2020年的G擴展區字:𰀾。

如果是 白雲深處人家网站主人 蔣門馬先生 加上去的,那是不会出现在图像扫描本里头的

“蒋注”在网站上用“备注”方式显示,应该就是蒋先生随字做了一些考证吧,大概没有相应出版物

2 Likes

正解…… :+1: :smiley:

11-21更新

每次Unicode添加新的漢字,WFG全宋體中的一批私有區字形就升級到標準字碼,然後舊的私有區碼位就被消除,或換成另外字形。因為WFG說文版沒有同時跟他的全宋體更新,被消除的私有區字就出問題:有的顯不出來;大多更嚴重,會顯出錯字。

比方說,“𢄢”字條,在最新的全宋體,楷書字頭是空白:
image

我把私有區字改成標準字:
image

“造”字條,私有區字變成錯字了:
image

改成標準字:
image

核心數據已更新到最新Unicode。
主mdd也包了需要用的字型。

修改記錄:

  • 𢄢字條:私有區 ➔標準字“𰏞”。加“𰏞”為異體字。
  • 涶字條:私有區󵠵➔標準字“𰝇”。把“𰝇”當字頭”;“涶”當異體。加了跳轉。
  • 唾字條:加“𰝇”當字頭”;把“涶”當異體字。
  • 占字條:私有區󶌃➔標準字“𰉏”。加“𰉏”為關聯字;加了跳轉。
  • 鼔字條:私有區󶓣➔標準字“𰚃”。加“𰚃”為關聯字;加了跳轉。
  • 隓字條:私有區󶏜➔標準字“𱀋”。加“𱀋”為關聯字;加了跳轉。
  • 𠧟字條:私有區󶏫➔標準字“𰀾”。加“𰀾”為關聯字;加了跳轉。
  • 并字條:私有區󰗜➔標準字“𰏤”。加“𰏤”為關聯字;加了跳轉。
  • 舜字條:私有區󵁴➔標準字“𰰊”。加“𰰊”為關聯字;加了跳轉。
  • 造字條:私有區󵃶➔標準字“𰍟”。加“𰍟”為關聯字;加了跳轉。
  • 婚字條:私有區󵄋➔標準字“𰘕”。加“𰘕”為關聯字;加了跳轉。
  • 災字條:私有區󵇜➔標準字“𰝸”。加“𰝸”為關聯字;加了跳轉。
  • 盾字條:私有區󶈓➔標準字“𰒦”。
  • 馬字條:私有區󰕑➔標準字“𰀪”。
3 Likes

支持更新。

中文字符码位一致恐怕是个永远的难题。原因是各种各样的字形太多了。如果有个信息实时互通的平台,也许可以减少类似问题。

《說文》里头不少非规则的字形(象形文字)恐怕就没有包含在下面这个标准中。当然有了标准可以解决99%以上的问题,是件好事。

卻是。處理漢字mdx,尤其是古漢語字典,太多難題在內。我作英英字典時,好輕鬆哦,選字型只講美觀而已哈哈,什麼都不用多想。
想起來有點可怕:自從Unicode 13.0(2020年)出來,所有用上全宋體私有區字的mdx都有可能有變形的問題。

加了[北師大]《章太炎說文解字授課筆記》文字版:

也加了中華書局整頁圖像版:


授課筆記:

  • 朱希祖筆記,三套;
  • 錢玄同筆記,兩套;
  • 周樹人(魯迅)筆記,兩套。

北師大文字版總共3,568字條;遺漏了紙書400多字條,尤其是對部首的解釋。數據原來有不少問題,例如:雈字條誤歸於萑;夊誤歸於夂;諴誤歸於誠;誖誤歸於諄,等等。還有需要修改的內容;使用時,要參照圖像板。

2 Likes

:+1: :+1: :+1:
想問下大佬,北師大說文網的古音歸字有打算加進去嗎

打造精品,支持

没必要贪大求全,不妨先这样。后面如果有更全的数据,或者有人本来就打算读一遍《章太炎說文解字授課筆記》的,机缘合适再逐步补全吧。

建议把上述提示加入到 后续版本MDX的 description 中

1 Like

無法統計到底遺漏多少。若字頭同時也是說文的部首,大多另有專門講部首的字條。數據完整的部分,北師大把兩條併成一條。或漏其中一條,或兩條全漏。要跟圖像版對比才有概念。
這兩天讀了一點,感覺很有價值。

處理圖片,同時用了Gaussian sharpen和Gaussian blur,一個削多餘的pixel,一個添上黑中之白洞,我覺得效果還不錯,筆畫密集的字蠻清晰,而且650頁的書最後只佔40MB哈哈。 :grinning:

2 Likes

maybe. 我琢磨古音該列在主要介面,還是挪到另外層次(像王力常用字的做法)。要加古音的話,大概不僅加北師大的內容。

2 Likes

楼主发布的新版提取了字典所用字,但在手机上还是不能显示正确字体。经过一番捣鼓,正文可以正常显示了,不过“字型演变”和图像版上方的字头还是黑体字,有些还是问号。可能是中华字型没提取完吧。
加了中华字型到字典文件夹,终于都正确显示了,哈哈哈。


只是,这个页码后的“頁”字为什么不显示呢?