【Raman】中医证病名大辞典【20231118】【图文综合版】

话说前不久shaoshi兄曾推荐过我一些中医的词典资源 其中很多都出自是佛爷的『辞书合集』 我曾经一度以残本为由婉言拒绝过他 :innocent: 但后来静下来转念一想 :face_in_clouds: 觉得shaoshi兄说的也有些许道理 于是在咱们论坛内检索了一下 发现其实shaoshi兄在这方面已为我辈先锋 首先分析了佛爷『辞书合集』的组成及词头数量 其次制作了2本较全的提取 于是在巨人的肩膀上 也决定试试看 虽然佛爷的数据是残本 但加上图片版的加持 就当作补完全璧吧 兹做了以下工作

  • 佛爷的数据同样有词头的问题 如 ()拼音混入 生僻字消失等一些列问题 共修改词头二百余个 和以前一样 感兴趣可详细看以下log 其中佛爷有的文字版词条1600左右
  • 加入图片版 我统计的图片版索引共词头8000个左右 前言说近万条 我就认为是四舍五入啦 哈哈哈
  • 之前做的词典联动 找到一些有问题的词头改之
  • 制作了『真』目录
  • 去掉了冗余的词条内容的换行 超链接 保持和原书格式一致
  • 制作了附录之类的

一句话: :heart:优点是词头整理及图文结合相互弥补不足 佛爷的残本(With all due repect)终于发挥出应有的价值 :disappointed_relieved:缺点是词头或有瑕疵以及文字词头略少

一瞥

封面

前言-文字

前言-图像

还是那句话 有就胜于无 抛砖引玉 剩下的就交给后来人吧 :stuck_out_tongue_closed_eyes:

下载

8 个赞

又一本图文综合版,厉害啊!

准备做《中医辞海》吗?

我奋力把《中医词释》的文本扫雷(真是扫雷而非扫叶,有很多因数据保护而插入的雷人现代词汇,例如“糕饼”),增补到7000条。看看似乎能做完,我用的知网入口就挂了。似乎无计可施了。

《中医大辞典》太大,想把第2版的词头弄出来,似乎完工也遥遥无期。只看了大约200页的词头。

可不可以在度盘或123,蓝秦网盘分享一下呢

shaoshi兄的毅力我真的是望尘莫及啊 现在主要将精力放在能做图文综合版的词典上 中医辞海我没有目录 只能先等等 现在正在啃上次提的那本选释 目录80多页 我正在人工校对 都快崩溃了 shaoshi兄是如何完成200多页目录的 :face_with_open_eyes_and_hand_over_mouth: 话说mdict的制作真的是蜀道难啊 不求沽名钓誉 但求有惠于后人 中医人是不是都是这样的 :innocent:

不是做了两百多页目录,是上次我用第1版的词头去匹配第2版正文ocr,匹配到大约三万条,用这些数据去对照原文图像。

匹配不到的,假如是错字,则改正。

假如是新词头,收纳,做记号。

只看了200页图像,停顿不前,前路漫漫。

中医词典真的很难弄啊。一个原因是中医的名词还没规范化,乱七八糟。A又作B、C,B又作A、D,C又作E、F、G,怎一个“乱”字了得。

还有,中医古籍出版社都是小出版社,编校水平和中华、上古这种古籍大社相比,差距不小啊。不止电子版有错误,图像版本身就有错误。

明白了 shaoshi兄所言极是 中医名词术语界乱象横生 这也是我为何先拿这类辞典开刀的原因 正本清源 至于本草 方剂 经典以后慢慢再说 究其原因 大部分归咎于 繁简 异体字不规范使用的问题 古人在古籍中使用就是多姿多彩 我感觉90年代的书还没有那么规范 就算是大出版社也不严格 全靠编者自我素质 但现在不一样了 感觉大家在这方面都有所提高 当然也只是那些大出版社 不过话说回来 恰恰因为异体字 汉字才如此美丽 中国传统文化才如此多元 希望以后这种无论是扫雷 扫叶 还是扫雪都能慢慢规避掉吧 :joy:

1 个赞