【Mastameta】說文解字（綜合版）2026.6.16

安静一些 · 2021 年11 月 20 日 05:24

为大徐本加上纸本图像（中华书局2013年）可好？https://pan.baidu.com/s/1Y3e_USmpD9f4gv5Znr1ulg
提取码：c07w

Mastameta · 2021 年11 月 20 日 05:42

多謝！看來章太炎說文解字授課筆記有3827條。

Mastameta · 2021 年11 月 20 日 06:36

那本的注解沒有mdx全，沒有“蔣注”。例如95頁，“𠧟”字條。

目前mdx大徐本“𠧟”字條的“蔣注”遺漏兩個字，我正在找這個。

請問有沒有帶“蔣注”的善本？知不知書名？我樂意加上去，但不去定要採用哪本書。

安静一些 · 2021 年11 月 20 日 06:53

楼主好，我不算内行，怀疑这里“蒋注”是今人加的，不存在带蒋注的善本，但我不知道“蒋”指谁。论坛里更了解的先生能否指教下？我也再查查看

安静一些 · 2021 年11 月 20 日 07:03

蒋马门整理电子本时所加？

有你真好 · 2021 年11 月 20 日 07:29

本字典的原始數據主要取自白雲深處人家蔣門馬先生相贈的《說文解字》綜合檢索系統離線版，經過修整、訂正，並合併了若干其他來源的資料而來。寧波蔣門馬先生耗費了多年的時間與精力，收集整理成極為完整的說文解字資料，承蒙相贈，並在製作的過程中多有說明、指正，不勝感激。

綜合檢索系統的原始數據有不少瑕疵，像陳昌治本的頁碼，是從四拼版頁碼換算而來，所以只有奇數沒有偶數。通訓定聲、說文義證頁碼也多有錯誤。經 suns99 兄出手相助，修復了陳昌治本頁碼，並增補了《說文解字校箋》、《說文解字注》(許惟賢本)的頁碼。《繫傳》文字也多有錯漏，原稿多處「云」誤作「雲」、「咸」誤作「鹹」，已人工粗略排查一遍。而《段注》文本文句缺漏甚多，不甚理想，後來找到志攀兄建立的 github，大規模修整後，取代了缺漏的段注文本。

整部字典以三本主要的《說文解字》著作——大徐本、小徐本(《說文解字繫傳》)、段注本(《說文解字注》)，並立為經，而以其他的輔助資料——書籍頁碼、相關附註為緯，交織出一個綿密的參考網絡。每一次查詢都能看到這三個版本的異同，如果備有各版書影還能快速參閱各種刻本原貌，段玉裁的《說文解字注》、朱駿聲的《說文通訓定聲》、桂馥的《說文解字義證》、王筠的《說文句讀》，清代「說文四大家」的頁碼索引一應具全，對於《說文解字》的研究，這是一個很方便的查考工具。

Mastameta · 2021 年11 月 20 日 08:48

謝謝指點。在說文解字圖像查閱逍遙子製作網頁翻了幾本圖像，還沒找到“蔣注”的來源。

但“𠧟”字條的遺漏字終於能補上去了，是Unicode 2020年的G擴展區字：𰀾。

endnote · 2021 年11 月 20 日 10:05

如果是白雲深處人家网站主人蔣門馬先生加上去的，那是不会出现在图像扫描本里头的

安静一些 · 2021 年11 月 20 日 10:31

“蒋注”在网站上用“备注”方式显示，应该就是蒋先生随字做了一些考证吧，大概没有相应出版物

有你真好 · 2021 年11 月 20 日 10:54

正解……

Mastameta · 2021 年11 月 21 日 07:35

11-21更新

每次Unicode添加新的漢字，WFG全宋體中的一批私有區字形就升級到標準字碼，然後舊的私有區碼位就被消除，或換成另外字形。因為WFG說文版沒有同時跟他的全宋體更新，被消除的私有區字就出問題：有的顯不出來；大多更嚴重，會顯出錯字。

比方說，“𢄢”字條，在最新的全宋體，楷書字頭是空白：

我把私有區字改成標準字：

“造”字條，私有區字變成錯字了：

改成標準字：

核心數據已更新到最新Unicode。
主mdd也包了需要用的字型。

修改記錄：

𢄢字條：私有區 ➔標準字“𰏞”。加“𰏞”為異體字。
涶字條：私有區󵠵➔標準字“𰝇”。把“𰝇”當字頭”；“涶”當異體。加了跳轉。
唾字條：加“𰝇”當字頭”；把“涶”當異體字。
占字條：私有區󶌃➔標準字“𰉏”。加“𰉏”為關聯字；加了跳轉。
鼔字條：私有區󶓣➔標準字“𰚃”。加“𰚃”為關聯字；加了跳轉。
隓字條：私有區󶏜➔標準字“𱀋”。加“𱀋”為關聯字；加了跳轉。
𠧟字條：私有區󶏫➔標準字“𰀾”。加“𰀾”為關聯字；加了跳轉。
并字條：私有區󰗜➔標準字“𰏤”。加“𰏤”為關聯字；加了跳轉。
舜字條：私有區󵁴➔標準字“𰰊”。加“𰰊”為關聯字；加了跳轉。
造字條：私有區󵃶➔標準字“𰍟”。加“𰍟”為關聯字；加了跳轉。
婚字條：私有區󵄋➔標準字“𰘕”。加“𰘕”為關聯字；加了跳轉。
災字條：私有區󵇜➔標準字“𰝸”。加“𰝸”為關聯字；加了跳轉。
盾字條：私有區󶈓➔標準字“𰒦”。
馬字條：私有區󰕑➔標準字“𰀪”。

endnote · 2021 年11 月 21 日 12:40

支持更新。

中文字符码位一致恐怕是个永远的难题。原因是各种各样的字形太多了。如果有个信息实时互通的平台，也许可以减少类似问题。

《說文》里头不少非规则的字形（象形文字）恐怕就没有包含在下面这个标准中。当然有了标准可以解决99%以上的问题，是件好事。

【Mastameta】王力古漢語字典（綜合版）9.30更新

古籍印刷通用字规范字形表
标准编号：GB/Z 40637-2021
标准状态：即将实施
标准价格：126.0 元
标准简介
本文件规定了古籍印刷通用字收字的原则和计算机宋体字字形规范的原则，并给出了14 250个古籍印刷通用字的字形、字音和在国际编码字符集ISO/IEC 10646中的码位。
本文件适用于1911年以前历代传世古籍的印刷与出版，也适用于现代书刊的繁体版印刷。
英文名称： Standard glyph list of generally used Chinese characters for ancient books publishing
标准状态：即将实施
中标分类：综合>>基础标准>>A22术语、符号
ICS分类：综合、术语学、标准化、文献>>词汇>>01.040.01综合、术语学、标准化、文献 (词汇)
发布部门：国家市场监督管理总局国家标准化管理委员会
发布日期：2021-10-11
实施日期：2022-05-01 即将实施距离实施日期还有164天
提出单位：教育部(语言)
归口单位：教育部(语言)
起草单位：北京师范大学文学院、商务印书馆有限公司、中华书局有限公司
起草人：王宁、**、王晓明、卜师霞、凌丽君、胡佳佳、周洪波、余桂林、孙述学、徐从权、马益新、洪涛、苏瑞欣、朱翠萍、秦淑华、胡珂
页数：236页
出版社：中国标准出版社
出版日期：2021-10-01

Mastameta · 2021 年11 月 21 日 14:38

卻是。處理漢字mdx，尤其是古漢語字典，太多難題在內。我作英英字典時，好輕鬆哦，選字型只講美觀而已哈哈，什麼都不用多想。
想起來有點可怕：自從Unicode 13.0（2020年）出來，所有用上全宋體私有區字的mdx都有可能有變形的問題。

Mastameta · 2021 年11 月 26 日 07:58

加了[北師大]《章太炎說文解字授課筆記》文字版：

也加了中華書局整頁圖像版：

授課筆記：

朱希祖筆記，三套；
錢玄同筆記，兩套；
周樹人（魯迅）筆記，兩套。

北師大文字版總共3,568字條；遺漏了紙書400多字條，尤其是對部首的解釋。數據原來有不少問題，例如：雈字條誤歸於萑；夊誤歸於夂；諴誤歸於誠；誖誤歸於諄，等等。還有需要修改的內容；使用時，要參照圖像板。

mitsuishi · 2021 年11 月 26 日 09:07

想問下大佬，北師大說文網的古音歸字有打算加進去嗎

endnote · 2021 年11 月 26 日 11:36

打造精品，支持

没必要贪大求全，不妨先这样。后面如果有更全的数据，或者有人本来就打算读一遍《章太炎說文解字授課筆記》的，机缘合适再逐步补全吧。

建议把上述提示加入到后续版本MDX的 description 中

Mastameta · 2021 年11 月 26 日 14:13

無法統計到底遺漏多少。若字頭同時也是說文的部首，大多另有專門講部首的字條。數據完整的部分，北師大把兩條併成一條。或漏其中一條，或兩條全漏。要跟圖像版對比才有概念。
這兩天讀了一點，感覺很有價值。

處理圖片，同時用了Gaussian sharpen和Gaussian blur，一個削多餘的pixel，一個添上黑中之白洞，我覺得效果還不錯，筆畫密集的字蠻清晰，而且650頁的書最後只佔40MB哈哈。

Mastameta · 2021 年11 月 26 日 14:26

maybe. 我琢磨古音該列在主要介面，還是挪到另外層次（像王力常用字的做法）。要加古音的話，大概不僅加北師大的內容。

alexpeng · 2021 年11 月 27 日 03:21

楼主发布的新版提取了字典所用字，但在手机上还是不能显示正确字体。经过一番捣鼓，正文可以正常显示了，不过“字型演变”和图像版上方的字头还是黑体字，有些还是问号。可能是中华字型没提取完吧。
加了中华字型到字典文件夹，终于都正确显示了，哈哈哈。

只是，这个页码后的“頁”字为什么不显示呢？

sy101 · 2021 年11 月 27 日 03:39

具体怎么操作能分享一下吗，中华字型没找到在哪下载，我也是手机版