【竹城的梦】蒙汉词典(修订版)内蒙古大学出 版社(1999)v.2023-12-16

词典制作者:竹城的梦
版本:2023-12-16
来源:http://hkuri.cneas.tohoku.ac.jp/

之前在b站上发过一个纯文字版,这一版加上了原书图片,补充了更多的西里尔文,校正了原数据的部分错误,也重新排版了。
css和js都放在了外面,方便编辑。字体也放在了外面,避免重复加载。

2023-8-13: 校正了标签错误导致的例句词缀显示错误的问题,建议更新

强烈建议不要自行更改蒙文的字体。若更改请特别注意特殊字形是否显示正确。

文件列表:

  1. 【2023-12-16】蒙汉词典(增订本)(1999).mdx (正文)
  2. 【2023-1-8】蒙汉词典(增订本)(1999).mdd (图片)
  3. 【2023-9-24】蒙汉词典(增订本)(1999).1.mdd (字体)
  4. 【2023-2-10】蒙汉词典(增订本)(1999).png (logo)
  5. 【2023-9-24】mhcd.css
  6. 【2023-8-13】mhcd.js

测试环境:

  1. Linux + Goldendict
  2. 安卓13 + DictTango

使用方式:

  1. 图片的mdd可以不下载,其他功能不受影响
  2. 将下载的文件放在同一文件夹下(mdx、mdd、png的文件名可修改,但必须保持一致,css、js的名称不能修改),再将此文件夹放入词典文件目录下
  3. 检索支持传统蒙古文、传统蒙古文拉丁转写、西里尔文
  4. 原书图片默认隐藏,点击页码可展开图片
  5. 示例默认显示,点击"例"按钮可隐藏
  6. 传统蒙古文的Unicode名称默认隐藏,点击"U"按钮可展开

数据问题及处理:

  1. 修正了原网站上极个别typo
  2. 原网站对部分词条添加了词典没有的西里尔文,此版本根据蒙古国2018正字法对个别书写进行了校正,并添加了缺失的部分西里尔文

已發現但暫未解決的問題:

  1. 没有完成全部词条的西里尔文的添加和校对

Changelog

2023-12-16: mdx

  1. 蒙古文字形校正:программ, энэхүү, ийнхүү, -хүү, 词义中的ču
  2. ZWJ SPACE U U > NNBSP U U
  3. SPACE xi > -xi, _xin > -xin, O' > O, SPACE xü > -xü, ürüsiyel > örösiyel
  4. 词末t' > t
  5. 漏字:заа
  6. 修正词头识别错误:mal aduγulaχu mal χariγulχu > mal aduγulaχu
  7. OCR错误: ԛᠢā ᠩ > ԛāng, ергөх > өргөх
  8. 修改错误的西里尔文:yangnalγ_a, dotonaxiv, taba-bar-iyan, хө > хүү, зуучлах > зууч
  9. 删除错误的西里尔文:ǰarmalaχu, нэгж|хэгц > нэгж
  10. 根据西里尔文正字法修改:xürxir_e, 补回专有名词变位后可能被错误删除的元音, шулмас> шуламс, исэх|эсэх > исэх, марзагнах|марзганах > марзганах, аймхай|аюумхай > аймхай, нулимс|нулмас > нулимс, гараг|гариг > гараг, айлгах|аюулгах > айлгах, бэлэгдэл > бэлгэдэл, логика > логик, соёнбо > соёмбо, очир|вачир > очир, номон > номин, аймшигтай|аюумшигтай > аймшигтай, дагни > дагниа, холхи|холхь > холхи, булаах|булиах > булаах, халти|хальт > халти, жавших|завших > завших, нигүүлсэх|нүүлсэх > нигүүлсэх
  11. 更新老蒙文转换为新蒙文的词库
  12. 纠正老蒙文转换为新蒙文的词组
  13. 纠正正则错误导致的xa丢失、蒙文例丢失
  14. 修正转写错误:st'anxi > st'anci
  15. 删去参见词条中词义编号前多余的空格
  16. 手动补充西里尔文:准格尔、эрхт, хааяагүй
  17. 更新老蒙文转换为新蒙文的算法:GEN, ACC
  18. 修改判断词干词性的函数(去除所有后缀和附加成分)
  19. 删除词义中-tai前多余的空格

2023-9-24: mdx css 蒙汉词典(增订本)(1999).1.mdd

  1. SPACE ZWJ U U > NNBSP U U
  2. 按蒙古国正字法更新西里尔文:өрөгдөл > өргөдөл, сацраг > цацраг, аврага > аварга, исгэлэн|эсгэлэн > исгэлэн, жавшаан|завшаан > завшаан, аугаа|уугаа > аугаа, бүүвэй|бүүвээ > бүүвэй, бүүвээлэх > бүүвэйлэх, хашгарах > хашхирах, 土耳其 Турк, xümüǰi-, хичнээн|хэчнээн > хэчнээн, номхон далай > Номхон далай
  3. 更新西里尔文:toγon temür χaγan, бүгд найрамдах ... ард улс 单词首字母大写, časilaχu, šabtal_a, dolobortoχu
  4. 删除错误的西里尔文:ǰëü
  5. 补充仅部分转换的西里尔文:Бүгд Найрамдах Дунд Ард Улс
  6. 删除css中的冗余和错误
  7. 修改蒙古文转换为西里尔文的算法:GEN, 四词短语1+1+2
  8. 更新蒙古文>西里尔文数据库
  9. 更新转写>拉丁的算法:š>S, ë>E
  10. 当前字体下调整字码:d'u, чийглэл, cU
  11. 漏字:ᠪᠦᠬᠦᠢ
  12. 删除空标签cnEx
  13. 同一个例子的mnEx合并
  14. 校正部分mnEx、cnEx混淆的问题
  15. 统一词义仅保留一个exmpToggle标签
  16. ◇改由css显示
  17. 字体改为Mongolian Baiti for TH Fonts,修改原字体!和?为竖直显示方向

2023-8-13: mdx css 蒙汉词典(增订本)(1999).1.mdd

  1. 根据蒙古国正字法校正西里尔文:obiyasu, χubiyari, čüngxü, χoitu, isegei, erbexei, dumda, umda, ton, xiri, ali xiri, abχaγulχu, yadaraγ_a, bambursi, tunudasu, γaγčaγar, neliyed, uxilaχu, rasiyan, bulanggir, belčiger, üχai
  2. 删除错误的西里尔文:ǰaxiyalaburi, duwang
  3. 删除转换不完全的西里尔文:аж ахуй
  4. 纠正错误的蒙古文:kilogram
  5. 规范css中的竖排显示,删除css中的冗余和错误
  6. 动态调整蒙文高度
  7. 更新传统蒙古文和同格、领属格、非过去时、联合副动词到西里尔文转换的算法,提高匹配度
  8. 更新传统蒙古文、西里尔文转换的算法数据库
  9. 纠正中文词义中的标点符号:᠂> ,
  10. 字体打包,西里尔文改为Palatino Linotype字体,蒙文采用Menk Qagan Tig
  11. 将原数据D转记为d'

2023-7-3: mdx css 字体mnglwhiteotf.ttf

  1. Tab按义项编号排序。
  2. 拉丁转写改为横排。
  3. 字体转换为Mongolian White。
  4. 根据当前字体校正найм、саяхан、маяг、намайг、чамайг、шиг、өө的传统蒙古文及转写。
  5. ši采用临时显示方案š"i, cu采用临时显示方案ču"
  6. 修正例子中的蒙文识别不完全导致的标签错误和显示错误。
  7. 修正西里尔文:čimayi, sudulγ_a,xeüxeldei, dangdan, la, tarbaG_a, ǰüičilelte, čiyanbir
  8. 根据蒙古国18正字词典修正西里尔文:toγtanil, baičai, tObed, γuwansa
  9. 校正单词末辅音γ的传统蒙古文词形。
  10. 补充西里尔文:ay_a
  11. 删除错误匹配的西里尔文:inǰënëring, ǰaidalaγ_a
  12. 补充词义缺乏的标号①
  13. 校正部分拼音
  14. 修改词义中词性出现导致的错误分行
  15. 修复拉丁转写中由于去除罗马数字编号导致的词尾xi的丢失
  16. 修改原数据传统蒙古文/转写的错误:man-u_kin, nexemel
  17. 提高键位检索的匹配度
  18. 修复传统蒙古文、西里尔文互转中GEN导致的书写错误
  19. 处理■\ue03c乱码
  20. 修正跳转词条的错误分行

2023-2-10: mdx、js、css、png

  1. 校正debUr_e音标。
  2. 去除单词末辅音t的fvs。
  3. 补充更多的西里尔文。
  4. 修改转写的编码,所见即所得,使用Charis SIL字体,索引兼容栗林均键位(γ、χ)。
  5. 校正网站数据错误ᠻ > ᠼ。
  6. 传统蒙古文的字体改为Mongolian Baiti,优点是处理历史拼写更准确,且能正确处理仅含有i元音的词字母g的形式,兼容ayi、ai型拼写,缺点是iOs上不能正确处理MVS,且字体偏小,和汉字混排更加麻烦。清文鉴中存在大量历史拼写,Mongolian Universal White不能正确处理。故为了统一更换了所有词典的字体。两者均不能正确处理仅含有i元音的词词中字母g的形式,需选择控制符FVS3。
  7. 校正g形式的错误:'ᠠᠩᠭᠯᠢᠴᠢᠯᠠᠬᠤ', 'ᠠᠩᠭᠯᠢᠵᠢᠬᠤ', 'ᠠᠩᠭᠯᠢᠴᠤᠳ'。
  8. 解决多tab词条无法翻页的问题。
  9. tab标签配上了不同文字相应的字体。
  10. 改用-转写(NNBSP)。

2023-1-8:mdx、mdd、js、css

  1. 修复词头带附加成分时不能展开Unicode的问题。
  2. 补充缺少的2、3、5、814、947页。
  3. 把图片由tif转化为png。
  4. 添加图片的上下翻页。
  5. 校正元音只有i的单词中g的形式。

GoldenDict显示效果(图片是整页的,截屏没截完)

DictTango

下载:

15 Likes

感谢楼主分享。这两天论坛打开速度奇慢,下载也是。

我这边很快唉。
传了个度盘,也可以试试哈

蒙汉词典(增订本)(1999)
链接: 百度网盘 请输入提取码 提取码: rs2c

字体
链接: https://pan.baidu.com/s/1FtCTlAwqRp1TXMjPZRRhqQ?pwd=5ib2 提取码: 5ib2

2 Likes

十分感谢,祝楼主新年快乐。

2 Likes

西里尔字母的蒙文就是不如回鹘式好看

准备分享给蒙族的师兄

小改了一下css,兼容iphone上mdict和欧路的文字方向
mhcd.zip (1.6 KB)

感谢更新,不过好像网盘里字体文件夹内的该字体未更新:

哦对,我都忘了网盘这事儿了。网盘里的版本没有更新过。更新都在论坛的cloud里。

说的就是论坛网盘的

我还以为你说的是度盘呢。

字体文件就是那个,我没有编辑过。我单独列在文件列表里是因为【7-3】版本之前,用的是另一个字体,需要换一下

哦哦 我看到该字体是2年前上传的,以为没有更新进去

感谢楼主为论坛小语种词典又开辟了新领域,说来惭愧,在内大读书的几年就没看懂过一句蒙文

很棒,做得很用心~

楼主好,想请教老蒙文换了三次字体,主要的差异在什么地方。新字体Menk Qagan Tig有什么优势比之前的两种字体好呢?

我也是在不断探索当中,目前尚未发现所有字形都能完全显示、和Unicode标准完全契合的字体。因为各本词典我都用的是一个蒙文字体,所以需要兼容清朝以来各个时代的拼法。

我选择字体的硬性标准是能够显示各个时代的词形。在此基础上,选择最符合Unicode标准的,即标准词形不使用控制符,特殊词形才需要使用控制符。几次换字体主要是遇到了无论使用任何控制符都不能正确显示字形的情况。比如Mongolian Universal White无法正确显示历史词形不带点的词中音节末辅音γ,Mongolian Baiti无法正确显示常用字形ngγ_a,Mongolian White好像是没发现什么硬性问题,但有位蒙授的朋友说Mongolian Baiti for TH-Fonts更符合蒙文审美,我看了一下,它符合Unicode规则的程度和又Mongolian White差不多,于是就换了。

感谢楼主的指点,我很担心用到不适合的字体,徒增许多校对困难。
Mongolian Baiti原本是不错的选择,毕竟可以同时显示满蒙文,但ngγ_a无法正确显示的话就成为麻烦了。Mongolian White试用之后确实好用,但您后来又改成Menk Qagan Tig,蒙科立的网站一直上不去,也下不了字体,不知道这个字体好不好用。

Mongolian White完全无法显示满文,Mongolian Universal White原本应该是不错的选择,但又有词形选错的问题。Noto Sans Mongolian显示满文时则完全是灾难。想弄一个合用的字体真难啊。

又想请教Mongolian Baiti在显示满文时有没有什么错误的地方?

显示满文的具体问题我没有记录,印象中Mongolian Baiti的词形选择问题比Mongolian Universal White多。有什么原因要用满蒙合用的字体吗?蒙文编码和显示的问题本身就已经太多了,如果还要高质量的兼容满文,就更难找到了。满蒙文的审美倾向也不太一样。

我现在都改成Mongolian Baiti for TH Fonts了。自从改用这个字体后满蒙文我就分用不同的字体了(我做的清文鉴里可以看到),所以不清楚满文的显示效果如何。
Mongolian_Baiti_for_TH_Fonts_Regular.ttf (310.0 KB)
满文用的是Abkai Xanyan。
Ab-Xy.ttf (165.5 KB)

这儿有Menk Qagan Tig,你也可以试试。
MQG8103.ttf (245.4 KB)

谢谢详细说明,并且提供字体文件~~~
会想合用是因为文章里东一个满文西一个蒙文,很怕选错字体漏看,成为四不像。
Mongolian Baiti for TH Fonts这是什么神奇的东西,网上查不到哩…

又Mongolian Baiti 因为是WIN自带,用来出版什么的应该都没问题,但其他的字体就不好说了…

查到另一位朋友也苦于这个字体问题

看来是个不小的坑

再次谢谢楼主的帮忙

那个帖子里的问题在一些字体里是没有的,比如Mongolian Baiti for TH Fonts(新蒙白)。可以参考一下下面的图,有一些词形容易错误的词在不同字体下的表现







1 Like