文件列表:
- 【2024-6-22】新蒙汉词典(1999).mdx (正文)
- 【2023-1-7】新蒙汉词典(1999).mdd (图片)
- 【2023-8-13】新蒙汉词典(1999).1.mdd (字体)
- 【2023-2-10】新蒙汉词典(1999).png (logo)
- 【2024-6-22】xmh.css
- 【2023-2-10】xmh.js
测试环境:
- Linux + Goldendict-ng,安卓13 + DictTango
使用方式:
- 图片的mdd可以不下载,其他功能不受影响
- 将下载的文件放在同一文件夹下(mdx、mdd、png的文件名可修改,但必须保持一致,css、js的名称不能修改),再将此文件夹放入词典文件目录下
- 检索支持传统蒙古文、传统蒙古文拉丁转写、西里尔文
- 原书图片默认隐藏,点击页码可展开图片,可点击上一页、下一页
- 传统蒙古文的Unicode名称默认隐藏,点击"U"按钮可展开
数据问题及处理:
- 修正了原网站上个别typo
- 双元音ayi > ai, eyi > ei, oyi > oi, uyi > ui
- ~替换成词头,方便全文搜索
Changelog:
2024-6-22:mdx、css
- 汉字OCR错误:{分 > 份,;)匕 > 北,规世音 > 观世音,毋台 > 跳,4卜 > 仆,拖玲 > 拖垮,虫且 > 蛆,大й :量 > 大批量,罗樓 > 罗嗦,贝占 > 贴,只广 > 见识广,薦 > 藨,萆 > 草,化误 > 讹误,中冒 > 帽,菩夢 > 菩萨,赞金 > 烫金,够雉 > 鸲雉,崩演 > 崩溃,傘 > 率,榇 > 棕,羊栖叶 > 羊柄叶,灰蟲晰 > 灰螽蜥,齣 > 鼩,鹋鹛/鹧 > 䴙䴘,哺 > 喃,叙 > 的,才艮 > 很,?肖 > 消,(由政)日截 > (邮政)日戳,月艮 > 服,艮口 > 即,目艮 > 眼,艮多孚ь > 很多乳,譯艮多 > 很多,艮р > 即,〗艮 > 眼,艮额 > 限额,遣路 > 道路,肩、> 息,样в 巴 > 那样吧,错 > 蜡,会氏 > 纸,书 шч 吾言 > 书面语言,力、理 > 办理,力、事员 > 办事员,力、称 > 小称, р 令 > 嘌呤, йтй > ,拉下的,剥 ии > 剥削,п 向 > 响,峰卿 > 蟑螂,副ш > 副票,效桌 > 效果,贪婆 > 贪婪,疙擦 > 疙瘩,发千 > 发干,岩笞 > 岩苔,油诟 > 油垢,肌动己 > 肌动描记,成№ > 成肌,锸 > 锰,日才 > 时,普通聘 > 普通䴓,角餐 > 角鲨,蔡黎 > 蒺黎,狗餐 > 狗鲨,秀发 > 秃发,僬 > 憔,牛接 > 牛犊,奪的 > 等的,奪子 > 凳子,奪 > 茸,狭溢 > 狭隘,鹋鹧 > 䴙䴘,華 > 苇,鵖 > 𱉼,轡軟 > 辔靫,恙 > 羔,脒 > 版,癒 > 磕,才申经错舌 > 神经错乱,聲 > 鹭,戟 > 绒,鞴 > 韂,缓 > 绶,蟲斯 > 螽斯,双 > 放,一践一魄 > 一跩一跩,胨 > 陈,叙 > 器,鲚 > 蛴,域 > 绒,歐 > 𫪘,軟 > 𫪘,莰 > 茓,口ч > 叫
- 统一为简体:締 > 缔,檻 > 槛,鮇 > 𱇛
- 西里尔字母OCR错误:зэрэгдэх > зэрэгцэх, пх > ш, дэгдээх的使动态 > дэгдэх的使动态, бадарх > бадрах,шугэм > шугам, юу4 > юу ч, унэ > үнэ, гуйлгээ > гүйлгээ, иий > ийн, ии > ий, 卡拉 ок > 卡拉OK, Aдьяа > Адьяа, Cумьяа > Сумьяа, Aнгараг > Ангараг,юс > их, баримтлахүзэл > баримтлах үзэл
- 符号OCR错误:v > ;,卍 > 卐,... > …, ; > ,, ;: > ;,,,> ,七一九 > 七——九
- 集中处理记为 〈高 的漏字
- 漏字:闹特 > 闹特殊;, _云 > 密云, 脾 > J牌, зарц > боол зарц,,力 > 能力,毁灭 > 毁灭性打击;, та хараагүй > та хараагүй ~?,光明,路 > 光明之路,明,的房间 > 明亮的房间,хар > ~ хар,面庞黑 > 面庞黝黑,日行市 > 当日行市,黑纹 > 黑纹𱉼;,指 > 指挥官:,透明 > 透明度:,套购票 > 套购票据;,салбар > салбар ~,Aтлантын > Атлантын,~гийн > ~гийн саа 肌麻痹,т № > 把洗了的,ш 谈这个,谈谈个 > 谈谈这个,谈谈那个,ш 房 > 毡房,ш 民 > 殖民,ш 网丝 > 胞网丝,ш 笔 > 粉笔,ш 矿 > 锰矿,ш 业 > 商业,ш 生素 > 维生素,马ш :带 > 马肚带,ш 紧 > 拉紧,ш > 〈动〉
- 多字:在将来一 > 在将来, (温顺)?
- 漏符号:,◊:
- 删除多余的符号:、;
- 词义部分使用中文引号
- 替换~时保留词头大小写
- 拉丁转写错漏:irtincU > yirtincU
- 传统蒙古文错误:bud'd'χa > bud'd'ha,词首t' > t
- 蒙古文编码: ǰo' > ǰo
- 处理~替换的错误和重复
- 删除ын、(ны)、наас、аараа、ынхан、“、的、;前以及”、同后多余的空格
- 删除中文环境中多余的空格
- 增加~前后应有的空格,删除不应有的空格
- ①前添加空格,其他编号前删除空格
- 纠正部分被识别为一级编号的二级编号
- 添加副词条和词义中缺失的空格
- 根据正字法加上GEN+нь结构中GEN的г,使用红色显示,点击可查看原文
- 处理页码错误:бадраах
- 校对原书错字,使用红色显示,点击可查看原文: нийтлэхэгүй > нийтлэхгүй,回虫 > 蛔虫,芥茉 > 芥末,马奶洒 > 马奶酒,螽蜥 > 螽斯,сахлга > сахлаг
2024-1-23:mdx、css
- 漏子:称 > 小称
- OCR错误:囁 > 嘣, (比高 >(比赛之), 口口 > 叩
- 删除词义中西里尔文和中文之间的空格,《空格 > 《
- 校对原书错字,用红色显示,鼠标悬停(PC端)或点击(手机端)则用黑色显示原文:дүгнүүлэх > дүгнүлэх
- 蒙古文:шиг, -ldögči > -ldügči 主词条:зургаадугаар > зургадугаар
2023-12-16:mdx、css
- 繁简转换:動 > 动
- 纠正个别错误编号:өрөө
- SPACE > NNBSP: өөтэй
- OCR错误:o > о, ньүугээр > нь үүгээр, будлах > буцлах, _概乐部 > 俱乐部, 臣卜 > 卧, 添 > 舔, 舔犊 > 舐犊, 浅_薄 > 浅薄, Ш > III, малвэ > мал вэ, e > ②, 马它 > 驼, 弓丨> 引, и 爵 > 嚼, 眉、惠 > 恩惠, 卞 > 下, 歹!} > 列, > > 》, гэсрийн тууль)> Гэсрийн тууль》, 优郁 > 忧郁
- 删除词头中不稳定的n前面的空格
- 蒙古文错别字:ergödel > ergüdel, negüres > negüresü, t'on > ton
- χorγol > χorγul
- 根据字体调整个别编码:англичууд, программ, ч
- 拉丁转写词末:t' > t
- 互动态拼写:ldo > ldu, ldö > ldü
- Unicode字体设为Times New Roman
- чийглэг蒙文删除FVS3
- 删除多余的冒号:эцэст
- 删除多余的逗号:гэрээ
- 删除多余的顿号:булан
- 删除多余的!:булан
- 删除多余的~: туурга
- 修改判断词干词性的函数(去除所有后缀和附加成分)
- 删除标点符号前多余的空格
- 规范中文省略号、引号
- 补充漏掉的词义:бэлчээр, ач
2023-8-13 mdx、css、新蒙汉词典(1999).1.mdd
- 处理原数据领属格被识别为-in的错误
- _xin > -xin, ' ᠬᠶᠢᠨ' > ' ᠬᠢᠨ'
- 规范同形的传统蒙古文:χoido > χoidu
- 改正错误的蒙古文:такт, килограмм
- 纠正错误的数字格式:мөнх
- 规范css中的竖排显示
- 罕见汉字转化为Unicode:鱼娄? ,虫+山+鬼
- 调整分号、括号前后的空白,调整西里尔文中的全角括号为半角
- 汉字后的半角分号改为全角分号
- 修复байгаль词条的乱码和漏字
- 错别字:霍(子) > 雹,全 体?> 全面体;
- 修复代码错误导致的西里尔文存在括号的情况下传统蒙古文到西里尔文映射的错误
- 将原数据D转记为d'
- _xü > -xü
- 字体打包,西里尔文改为Palatino Linotype字体,蒙文采用Menk Qagan Tig
2023-7-3 mdx
- 漏字:санаатай
- 处理词中_的显示:шийгуа
- 识别乱码:「;ф」
- 提高键位检索的匹配度
2023-6-17 mdx、css、字体mnglwhiteotf.ttf
- 转写改成横排。
- 字体转换为Mongolian White。(原字体不能正常显示ngγ_a,多翻比较后更换了字体)
- 根据当前字体校正найм、саяхан、ngγ_a、маяг、шиг的传统蒙古文及转写。
- 校正传统蒙古文错别字:инженер ес есөн
- 补充原数据漏掉的~:бэр
- 校正因~未留空格导致的示例中空格的缺乏以及хж、бурханы等错误错误
- 校正识别错误的字:「нө;хцөл」「神像画_匠+、」「果子,;存丄、」「螺娜」「朗匙」「огторгуйн」
- 词义tab按照词典给出的/1 /2 /3排序
- _ki对应的连接符由\u180e改为\u202f,χoito-du > χoitu-du
2023-2-10 mdx、js、css、png
- 错别字及其他录入错误:訪绸 > 纺绸,上子# > 上子弹,0苗准 > 瞄准,凭ш > 凭据。
- Unicode:然+鸟? > 䳿。
- 删除重复的tab。
- 校正网站传统蒙古文错误 ᡂ > ᠼ 。
- 修改转写的编码,所见即所得,使用Charis SIL字体。
- 传统蒙古文的字体改为Mongolian Baiti,优点是处理历史拼写更准确,且能正确处理仅含有i元音的词词末字母g的形式,兼容ayi、ai型拼写,缺点是iOs上不能正确处理MVS,且字体偏小,和汉字混排更加麻烦。清文鉴中存在大量历史拼写,Mongolian Universal White不能正确处理。故为了统一更换了所有词典的字体。两者均不能正确处理仅含有i元音的词词中字母g的形式,需选择控制符FVS3。
- 校正g形式的错误:'ᠠᠩᠭᠯᠢᠴᠢᠯᠠᠬᠤ', 'ᠠᠩᠭᠯᠢᠵᠢᠬᠤ', 'ᠠᠩᠭᠯᠢᠴᠤᠳ'。
- 解决多tab词条无法翻页的问题。
- tab标签配上了不同文字相应的字体。
- 保留原网站使用的=(连接动词词尾)、-(NNBSP)。
- 导航栏保留义项编号,并按编号给tab排序。
2023-1-8 mdx、js
- 校正元音只有i的单词中g的形式。
- 修改了js中翻页的问题。
- 去除单词末辅音t的fvs。
GoldenDict
DictTango
下载: