【竹城的梦】清文鑑合集 [满蒙汉藏日] v.240707

清文鑑合集

词典制作者:竹城的梦@b站
版本:2024-7-7

来源

  1. 《三合切音》图片 https://archive.org/
  2. 栗林均 http://hkuri.cneas.tohoku.ac.jp/

词典内容

  1. 《大清全书》康熙22年(1683)【满汉】
  2. 《御制満蒙清文鑑》康煕56年(1717)【满蒙】
  3. 《御制増订清文鑑》乾隆36年(1771)【满满汉】
  4. 《御制満珠蒙古汉字三合切音清文鑑》乾隆45年(1780)【满蒙汉】
  5. 《御制五体清文鑑》约乾隆末年(~1796)【满蒙汉日】
  6. 《蒙文倒纲》咸豊元年(1851)【满蒙汉】
  7. 《蒙文總彙》光绪辛卯(1891)【满蒙汉】
  8. 《蒙漢字典》蒙文書社(1928)【蒙漢】
  9. 《二十一卷本辞典》内蒙古人民出版社(1977)【蒙蒙】

收录说明

  1. 《御制五体清文鑑》一书包括满、藏(及满文对音)、蒙、回(及满文对音)、汉。原网站仅录入了满、蒙、汉,并添加了日文解释,其来源不详
  2. 根据满文转写、蒙古文转写添加了对应的满文、蒙古文
  3. 《二十一卷本辞典》爲1977年出版,将之纳入此合集是因爲它是翻译《御制满蒙合璧文鉴》之作
  4. 同理,1928年出版的《蒙漢字典》也纳入了此合集

【2024-6-22】首次纳入五体清文鉴藏文部分

文件列表

  • 【2024-7-7】清文鑑合集.mdx
  • 【2023-2-5】清文鑑合集.png (图标)
  • 【2023-2-5】清文鑑合集.mdd(《大清全书》图片)
  • 【2023-2-5】清文鑑合集.1.mdd(《満蒙清文鑑》图片)
  • 【2023-2-5】清文鑑合集.2.mdd(《三合切音》图片)
  • 【2023-1-17】清文鑑合集.3.mdd(《御制五体清文鑑》图片)
  • 【2023-2-5】清文鑑合集.4.mdd(《蒙文倒纲》图片)
  • 【2023-1-17】清文鑑合集.5.mdd(《蒙文總彙》图片)
  • 【2023-2-5】清文鑑合集.6.mdd(《蒙漢字典》图片)
  • 【2024-7-7】清文鑑合集.7.mdd(字体文件)
  • 【2024-7-7】qwj.css
  • 【2023-2-5】qwj.js

测试环境:

  1. Linux + Goldendict-ng,安卓14 + DictTango

字体说明

  1. 经过一段时间的使用,综合考虑后我目前决定把所有字体打包。请直接下载“清文鑑合集.7.mdd”。
  2. 传统蒙古文的编码和显示目前还比较混乱。国际/国家标准的设计思路是由字体自动选择独立、词首、词中、词末型和阴阳型,不能自动判断的由控制符(FVS)辅助选择。目前采用的是Mongolian Baiti for TH Fonts。满文目前采用的是Abkai Xanyan。五体清文鉴日文释义部分含蒙/满文,无法自动识别语言,故采用Mongolian Universal White统一显示蒙/满文。
  3. 汉文部分存在大量生僻字,照搬了 @Mastameta 说文解字词典的设置。
  4. 转写部分换成了Charis SIL,可以正确处理各式附加符号。

蒙古文转写

  1. 鲍培转写针对的是古蒙古语,辅音区分阴阳,不包含近现代产生的大量词汇。再加上不少词形在演变过程中发生了分化,很多时候鲍培转写不能无损记录词形。虽然现在鲍培转写使用得仍然最广泛,但实际上并没有统一的标准,各处使用的版本都存在不小的差异。
  2. 2005年,中蒙联合转写方案(ISO/TC 46/WG 3)提交(暂未通过)。此方案由于直接与Unicode挂钩,辅音不区分阴阳,是完全无损的蒙古文转写。常用部分二者的差异并不大。
  3. 综上,这里使用的基础是中蒙联合转写方案,但保留了两组辅音的阴阳型,即γ和g、χ和x。编码所见即所得。
  4. 词典中“@凡例”词条可查看详细的转写对比表以及编撰逻辑。

检索方式

  1. 蒙古文及其转写、满文及其转写、中文、藏文及其转写。
  2. 词头含有多个单词的,进行了拆分,可以分别检索。
  3. 蒙古文转写检索兼容X/x、G/g两组。同时,GoldenDict在处理带附加成分的拉丁字母时会自动忽略附加成分。例如,检索šala,只用搜索sala。(DictTango不适用)
  4. 蒙古文动词兼容现代词典型,蒙古文及其转写两个检索方向均适用。例如,检索χarimui, 可搜索XariXu(直接跳转)、xarixu(检索面板可选XariXu)。
  5. 蒙古文索引兼容ayi、ai型,蒙古文及其转写两个检索方向均适用。
  6. 转写索引忽略FVS:' " `。
  7. 中文索引使用了国内古籍印刷标准的正字。例如,检索词头“卧”,则词条包含所有含卧、臥的辞书页面,但检索“臥”,没有搜索结果。可以配合软件预设的异体表使用,使得检索词头“臥”时“卧”会自动出现在检索面板以供选择。 已将异体字词头跳转至正字词头,可直接检索异体字。

数据问题及处理

  1. 校对:
    • 原数据生僻字採用■(鱼+替)的方式记录,本词典试图把UNICODE已编码的改爲UNICODE,未编码的由IVS的方式显示,如⿰鱼替,但尚未处理完全。
    • 栗林均先生的校对成果(网站上用?!分别表示),索引中采用校对后的词条,为了提高检索成功率,部分已校正,故那些词条显示的文字与提供的图片不同,词条保留校对前后的文字,默认显示校对后的结果,不同的字体反映不同的校对类型,桌面版鼠标悬停、手机版点击可显示校对前的原文。
    • 汉文部分的校对存在不少问题,制作时若发现进行了纠正。
    • 汉文部分使用了大量的异体字,原则上词条中全部保留,但词头采用正体。转换十分粗糙,直接使用StarCC 改用opencc,标准是《古籍印刷通用字規範字形表》(GB/Z 40637-2021)。
    • 原网站没有的校对,蒙古文部分存在明显问题、汉文部分存在问题的仿照栗林先生格式进行了校对。
    • 以上皆是随用随改,故尚未校对完全。
  2. 蒙古文转写:
    • 转写所见即所得,方便搜索。
    • 保留ayi型转写,索引兼容ai型。
    • 个别名词转写末尾错误添加=,部分已校正
  3. 满文转写:
    • 原数据满文转写@v混用,已全部统一爲ū。
    • 字母ᡧ由S、x统一为š
    • 满文转写的小i用空格分隔,按莱比锡缩写系统已全部改爲=
  4. 满文、蒙古文系本人由网站收录的拉丁转写转换而得,如有错误欢迎反馈。
  5. 图片优先由[卷-页-正反]的方式编号(例12-38b,即第十二卷第38页b面),其次按词条编号(五体清文鉴),再次按页码编号。

使用方式

  1. 图片的mdd可以不下载,其他功能不受影响.
  2. 将下载的文件放在同一文件夹下,保证文件名相同。在将此文件夹放入词典文件目录下。
  3. 支持满文、满文拉丁转写、蒙古文、蒙古文拉丁转写、中文检索。
  4. 点击导航栏可以切换不同的词典。
  5. 点击[卷-页-正反]按钮可展开词条内容。
  6. 点击书本图标可展开原文图片,左右箭头可进行翻页。
  7. 默认显示转写,可选择隐藏转写。
  8. 默认隐藏单词切分,可选择显示。

Changelog:

2024-7-7: mdx、css、7.mdd(字体文件)
  1. 强行将汉、日标签设置为upright,兼容更多设备上竖排的正确显示
  2. 改为使用opencc处理繁体正字
  3. 繁体正字:閒 -> 閑,鍼 -> 針
  4. 生僻字:■(山+困)-> 𡹤
  5. 处理生僻字映射重复的索引
  6. 异体字添加索引跳转,如“好閒走人”跳转至“好閑走人”。原词条索引仍使用正字“閑”
  7. 增加FSung-2字体以显示生僻字

2024-6-22: mdx、css、7.mdd(字体文件)

  1. 字体与编码兼容:xü'ü > xü`ü
  2. 校正五体清文鉴重复数据
  3. 增加五体清文鉴藏文部分
  4. 五体清文鉴日文释义中的转写改为蒙/满文字母,由Mongolian Universal White统一显示
  5. 增加藏文字体
  6. 三合切音:氷 > 冰
  7. 索引使用异体字的标准体:氷 > 冰
  8. 蒙汉字典字段划分错误:qarayi=n od=u=mui
  9. 蒙文倒纲处理批注意见:qarbu=qu tOgUrig bai[?] > qarbu=qu tOgUrig bai
  10. 蒙汉字典处理批注意见:簷凌[?] > 簷凌
  11. 微调格式,删除hr

2023-7-29 重要更新: mdx、css、清文鑑合集.7.mdd(字体文件)

  1. 对满文、蒙文采用不同的标签。蒙文采用Menk Qagan Tig,满文采用Abkai Xanyan,日文采用MS PMincho。
  2. 去除了动词词典型兼容时的连接元音u:umui > xu。
  3. 校正蒙汉字典:-yier, -yiar, -yian, -yian
  4. 校正蒙文倒纲:-yin[!] > -yin
  5. 满文转写:=i > -i
  6. 校正拼写:naiman、namayi、cimayi

2023-2-10: mdx、css

  1. 删除@转写方案,添加@凡例,并根据栗林先生著作的凡例(引用日语原文,未翻译),逐条说明处理思路和进度。
  2. ü`更改为ü'。
  3. 转写中的非字母部分按栗林均方案:=、-、+、_。
  4. 转写的=、+加入默认隐藏切分。
  5. 修复《满蒙文鉴》满文查询方向蒙文词头不能隐藏切分的问题。
  6. 修正minü、cinü的拼写。
  7. 拆分词条:《蒙文总汇》《蒙汉字典》xele。
  8. 《二十一卷本》合并“/数字”式词头。
  9. 《二十一卷本》去掉索引中的=。
  10. 《二十一卷本》k i=jU > ki=jU, t ere > tere。
  11. 删除字符●。
  12. css错字fmargin-left。
  13. 《蒙文总汇》满文同义词格式。
  14. 合并词条:nada-luG_a。
  15. 修正带有tag的未切分的转写的显示问题。
  16. 校正《蒙文总汇》少量的kh字母(网站记为k字母)。
  17. 转写:N > n'。

2023-2-5:js、css、mdx、mdd、1.mdd、2.mdd、4.mdd、6.mdd

  1. 添加了《蒙汉字典》。
  2. 添加了《三合切音》的图片。
  3. 补充漏抓的附加成分(网站上《满蒙文鉴》《蒙文倒纲》《蒙汉字典》中以-开头的词条,共42条)。
  4. 原来的代码难以维护,故重新写了,大大提高了检索成功率,变化无法一一列举。
  5. 替换了大量的生僻字、异体字为Unicode。
  6. 更换了蒙古文转写方案,且编码上改为所见即所得。
  7. 更换了满文转写的编码方式,所见即所得。
  8. 图片的索引方式改为[卷-页-正反]。
  9. 汉文索引统一部分异体字。
  10. 调整了排版,导航更简短,同一词头不同词条分页显示,调整了标签配色。 显示注、同等。校对结果分颜色显示。
  11. 无论词典语种,均按照蒙满汉日的顺序显示。按不同的检索方向,把词头语种提前,即检索汉文,显示顺序为汉蒙满日。
  12. 解决了检索转写时同时存在满文词头和蒙古文词头时的显示问题。
  13. 改回ayi型转写,索引兼容ai型。
  14. 词头由多个词的,进行了更细致的拆分,但词条显示保持完整。
  15. 更换了满蒙文字体(Mongolian Baiti),编码进行了对应的调整。索引兼容栗林均键位(γ、χ)。
  16. 更换了转写的字体(Charis SIL)。
  17. 更换了汉文字体(全宋、中华宋),用于显示生僻字。
  18. 动词索引兼容现代词典型。
  19. 图片改为100%显示大小。

2023-1-17

  1. 《大清全书》拉丁转写x改为S
  2. 修复《大清全书》拉丁转写@改为v的过程中index产生的错误
  3. 《蒙文总汇》蒙古文转写_改为=
  4. 校正Ga不带点的音节
  5. 校正只含有元音i的单词的拼写
  6. =a, =e校正为_a, _e
  7. 校对《蒙文倒纲》joGuGki=mui
  8. 解决词头中括号里的部分不显示的问题
  9. Unicode:'■(火+牙)': '𤆹', '■(毛+隼)': '𣯍',(片+戈)': '𢦤', '■(イ+店)[掂?]': '𫢶', '■(イ+店)': '𫢶', '■(扌+总)': '搃', '■(央+鳥)': '𩿶', '■(扌+茲)': '𢰩', '■(?+班)魚': '㿀魚', '■(口+么)': '吆', '■(敦+鳥)': '𪆃', '■(木+鬲)': '槅', '■(未+鳥)': '𩿲', '■(卒+刂)': '𱐟', '■(疒+班)': '㿀', '■(名+刂)': '𭃞', '■(犭+然)': '𤡮', '■(犭+頡)': '𤢺', '■(禾+么)': '𥝠', '■(卄+涉)[沙?]': '𦶼', '■(犭+包)': '狍', '■(犭+也)': '𤜣', '■(ネ+華)': '𥛵', '■(牙+夂+厂+水)': '𣺶','■(波+木)': '𭪰', '■(?+支)': '𢿦', '■(牚+支)[撞?]': '𢿦', '■(尨+鳥)': '𪁪', '■(歯+可)': '䶗', '■(舟+敢)': '𦪧', '■(糸+吊)': '𬗏', '■(貝+貳)': '𧸐', '■(漱?)': '溂', '■(月+菐)': '𦢂', '■(章+鳥)': '𪅂', '■(舟+吕)': '𮎎', '■(衤+柰)': '𧛮', '■(多+皮)[皴?]': '皴','■(魚+匕)': '𩵏', '■(髟+狄)': '䯼'

下面的都是旧图,可以比较一下效果

GoldenDict显示效果

DictTango


下载:

11 Likes

楼主是研究蒙古文的嘛,现在做这个的人多吗?

3 Likes

我只是个半吊子。。国内做这个的比较少,不过仍然算是民族语言里相对较多的。最多的在蒙古国和日本,俄罗斯、德国、韩国也有一些。但总的来说,研究非常欠缺,连对相当一部分时、体、情态的认识都还是一团乱麻

2 Likes

栗林先生的辞典中,有些会有这种现象,他好像没有发现,说明中也没提到。

有个小小建议,现在的正文内容中的满蒙文,固然依照栗林先生的设计,用大写或v/x来表示满蒙文的特殊用字,在键盘上查挺方便,但引用时还要经过一道手续将其转成正式的转写,且全文搜寻时有点儿费劲…或许可以另外加上一条正式转写(蒙文Poppe、满文Moellendorff,且不要把词干与语尾切开),则更为完整。

1 Like

第一次有人给我的词典提建议 :joy:

这其实是两个思路。栗林均先生是用字体来完成码位到显示形式的映射,而码位和键位是相同的。另一种是通过输入法实现键位到码位的映射,不需要特殊的字体来实现正确的显示形式。

我也觉得第二种在引用和全文搜索时更方便。之前我一直没动这个是因为有些细节不知道该怎么处理,比如蒙文历史上字母G是没有两点的,后来为了区分才加上,但在清文鉴中,哪怕在同一册中,不同的单词处理得也不一样。其他的变体怎么处理也拿不准。而且各文献中使用的鲍培氏转写本身就不太一样。满文我只学了拼读,更不知道怎么弄了。

但如果只是按照栗林均网站上的显示效果直接编码,比如G替换成ɣ,v/@替换成ū,再去掉词素边界标记,就很简单了。

另外我觉着词干和后缀切分对有些朋友可能还是有用,设计一个开关可能更好。

1 Like

栗林先生有一部份原数据,š用x表示,

123

第一次贴图不知道能否显示
给您参考。

天冷,大家多保暖

改过来了。《大清全书》的原数据质量没其他基本好。

Changelog:
2023-1-17

  1. 《大清全书》拉丁转写x改为S
  2. 修复《大清全书》拉丁转写@改为v的过程中index产生的错误
  3. 《蒙文总汇》蒙古文转写_改为=
  4. 校正Ga不带点的音节
  5. 校正只含有元音i的单词的拼写
  6. =a, =e校正为_a, _e
  7. 校对《蒙文倒纲》joGuGki=mui
  8. 解决词头中括号里的部分不显示的问题
  9. Unicode:'■(火+牙)': '𤆹', '■(毛+隼)': '𣯍',(片+戈)': '𢦤', '■(イ+店)[掂?]': '𫢶', '■(イ+店)': '𫢶', '■(扌+总)': '搃', '■(央+鳥)': '𩿶', '■(扌+茲)': '𢰩', '■(?+班)魚': '㿀魚', '■(口+么)': '吆', '■(敦+鳥)': '𪆃', '■(木+鬲)': '槅', '■(未+鳥)': '𩿲', '■(卒+刂)': '𱐟', '■(疒+班)': '㿀', '■(名+刂)': '𭃞', '■(犭+然)': '𤡮', '■(犭+頡)': '𤢺', '■(禾+么)': '𥝠', '■(卄+涉)[沙?]': '𦶼', '■(犭+包)': '狍', '■(犭+也)': '𤜣' '■(ネ+華)': '𥛵', '■(牙+夂+厂+水)': '𣺶', '■(波+木)': '𭪰' '■(?+支)': '𢿦', '■(牚+支)[撞?]': '𢿦', '■(尨+鳥)': '𪁪', '■(歯+可)': '䶗', '■(舟+敢)': '𦪧', '■(糸+吊)': '𬗏', '■(貝+貳)': '𧸐', '■(漱?)': '溂', '■(月+菐)': '𦢂', '■(章+鳥)': '𪅂', '■(舟+吕)': '𮎎', '■(衤+柰)': '𧛮', '■(多+皮)[皴?]': '皴', '■(魚+匕)': '𩵏', '■(髟+狄)': '䯼'
1 Like

感谢更新,改了好多好多啊。

古人说书非校不能读,我觉得数据库也是,
单查一个两个语词很难看出问题,整个库一块搜寻,问题就如扫落叶,扫了又出现。

清文鉴里头有很多独有的字词,近代词典查不到。
竹城重新整理,统一了拼写,修改了文本错误,
解放了很多原来在线不容易查到的点儿,有很重要的价值。

一切都很棒,再次感谢。
祝福新年大吉祥,平安健康!

1 Like