文件列表:
- 【2023-12-16】新蒙汉词典(1999).mdx (正文)
- 【2023-1-7】新蒙汉词典(1999).mdd (图片)
- 【2023-8-13】新蒙汉词典(1999).1.mdd (字体)
- 【2023-2-10】新蒙汉词典(1999).png (logo)
- 【2023-12-16】xmh.css
- 【2023-2-10】xmh.js
测试环境:
- Linux + Goldendict-ng
- 安卓13 + DictTango
使用方式:
- 图片的mdd可以不下载,其他功能不受影响
- 将下载的文件放在同一文件夹下(mdx、mdd、png的文件名可修改,但必须保持一致,css、js的名称不能修改),再将此文件夹放入词典文件目录下
- 检索支持传统蒙古文、传统蒙古文拉丁转写、西里尔文
- 原书图片默认隐藏,点击页码可展开图片,可点击上一页、下一页
- 传统蒙古文的Unicode名称默认隐藏,点击"U"按钮可展开
数据问题及处理:
- 修正了原网站上个别typo
- 双元音ayi > ai, eyi > ei, oyi > oi, uyi > ui
- ~替换成词头,方便全文搜索
Changelog:
2023-12-16:mdx、css
- 繁简转换:動 > 动
- 纠正个别错误编号:өрөө
- SPACE > NNBSP: өөтэй
- OCR错误:o > о, ньүугээр > нь үүгээр, будлах > буцлах, _概乐部 > 俱乐部, 臣卜 > 卧, 添 > 舔, 舔犊 > 舐犊, 浅_薄 > 浅薄, Ш > III, малвэ > мал вэ, e > ②, 马它 > 驼, 弓丨> 引, и 爵 > 嚼, 眉、惠 > 恩惠, 卞 > 下, 歹!} > 列, > > 》, гэсрийн тууль)> Гэсрийн тууль》, 优郁 > 忧郁
- 删除词头中不稳定的n前面的空格
- 蒙古文错别字:ergödel > ergüdel, negüres > negüresü, t'on > ton
- χorγol > χorγul
- 根据字体调整个别编码:англичууд, программ, ч
- 拉丁转写词末:t' > t
- 互动态拼写:ldo > ldu, ldö > ldü
- Unicode字体设为Times New Roman
- чийглэг蒙文删除FVS3
- 删除多余的冒号:эцэст
- 删除多余的逗号:гэрээ
- 删除多余的顿号:булан
- 删除多余的!:булан
- 删除多余的~: туурга
- 修改判断词干词性的函数(去除所有后缀和附加成分)
- 删除标点符号前多余的空格
- 规范中文省略号、引号
- 补充漏掉的词义:бэлчээр, ач
2023-8-13 mdx、css、新蒙汉词典(1999).1.mdd
- 处理原数据领属格被识别为-in的错误
- _xin > -xin, ' ᠬᠶᠢᠨ' > ' ᠬᠢᠨ'
- 规范同形的传统蒙古文:χoido > χoidu
- 改正错误的蒙古文:такт, килограмм
- 纠正错误的数字格式:мөнх
- 规范css中的竖排显示
- 罕见汉字转化为Unicode:鱼娄? ,虫+山+鬼
- 调整分号、括号前后的空白,调整西里尔文中的全角括号为半角
- 汉字后的半角分号改为全角分号
- 修复байгаль词条的乱码和漏字
- 错别字:霍(子) > 雹,全 体?> 全面体;
- 修复代码错误导致的西里尔文存在括号的情况下传统蒙古文到西里尔文映射的错误
- 将原数据D转记为d'
- _xü > -xü
- 字体打包,西里尔文改为Palatino Linotype字体,蒙文采用Menk Qagan Tig
2023-7-3 mdx
- 漏字:санаатай
- 处理词中_的显示:шийгуа
- 识别乱码:「;ф」
- 提高键位检索的匹配度
2023-6-17 mdx、css、字体mnglwhiteotf.ttf
- 转写改成横排。
- 字体转换为Mongolian White。(原字体不能正常显示ngγ_a,多翻比较后更换了字体)
- 根据当前字体校正найм、саяхан、ngγ_a、маяг、шиг的传统蒙古文及转写。
- 校正传统蒙古文错别字:инженер ес есөн
- 补充原数据漏掉的~:бэр
- 校正因~未留空格导致的示例中空格的缺乏以及хж、бурханы等错误错误
- 校正识别错误的字:「нө;хцөл」「神像画_匠+、」「果子,;存丄、」「螺娜」「朗匙」「огторгуйн」
- 词义tab按照词典给出的/1 /2 /3排序
- _ki对应的连接符由\u180e改为\u202f,χoito-du > χoitu-du
2023-2-10 mdx、js、css、png
- 错别字及其他录入错误:訪绸 > 纺绸,上子# > 上子弹,0苗准 > 瞄准,凭ш > 凭据。
- Unicode:然+鸟? > 䳿。
- 删除重复的tab。
- 校正网站传统蒙古文错误 ᡂ > ᠼ 。
- 修改转写的编码,所见即所得,使用Charis SIL字体。
- 传统蒙古文的字体改为Mongolian Baiti,优点是处理历史拼写更准确,且能正确处理仅含有i元音的词词末字母g的形式,兼容ayi、ai型拼写,缺点是iOs上不能正确处理MVS,且字体偏小,和汉字混排更加麻烦。清文鉴中存在大量历史拼写,Mongolian Universal White不能正确处理。故为了统一更换了所有词典的字体。两者均不能正确处理仅含有i元音的词词中字母g的形式,需选择控制符FVS3。
- 校正g形式的错误:'ᠠᠩᠭᠯᠢᠴᠢᠯᠠᠬᠤ', 'ᠠᠩᠭᠯᠢᠵᠢᠬᠤ', 'ᠠᠩᠭᠯᠢᠴᠤᠳ'。
- 解决多tab词条无法翻页的问题。
- tab标签配上了不同文字相应的字体。
- 保留原网站使用的=(连接动词词尾)、-(NNBSP)。
- 导航栏保留义项编号,并按编号给tab排序。
2023-1-8 mdx、js
- 校正元音只有i的单词中g的形式。
- 修改了js中翻页的问题。
- 去除单词末辅音t的fvs。
GoldenDict
DictTango
下载: