【竹城的梦】MongolToli 词典+历史词典 [蒙蒙,发音] v.2023-8-13

词典制作者:竹城的梦@b站
版本:2023-8-13
来源:https://mongoltoli.mn/及其app
  • 包括Монгол хэлний их тайлбар толь(МХИТТ)和Монголын түүхийн тайлбар толь(МТТТ)。
  • 之前在b站发过一个仅有МХИТТ的版本。这个版本加入了МТТТ的全部内容,包括文字、图片、词条发音、对应的传统蒙古文。此外,还进行了重新排版,清洗了html,删除了发现的重复词条,补充了更多的传统蒙古文。

文件列表:

  1. 【2023-8-13】 MongolToli.mdx
  2. 【2023-1-3】 MongolToli.mdd (МХИТТ发音)
  3. 【2023-1-3】 MongolToli.1.mdd (МТТТ发音)
  4. 【2023-1-3】 MongolToli.2.mdd (插图)
  5. 【2023-1-3】 MongolToli.3.mdd (МТТТ传统蒙古文)
  6. 【2023-8-13】MongolToli.4.mdd (字体)
  7. 【2023-1-3】 MongolToli.png (logo)
  8. 【2023-8-13】 MongolToli.css
  9. 【2023-8-13】 MongolToli.js

测试环境:

  1. Linux + Goldendict
  2. 安卓13 + DictTango

使用方式:

  1. 音频、图片的mdd可以不下载,其他功能不受影响。
  2. 将下载的文件放在同一文件夹下,保证mdx、mdd和png的文件名相同,不要修改css、js的名称,再将此文件夹放入词典文件目录下。
  3. 支持检索西里尔文、传统蒙古文及其拉丁转写。
  4. 点击MT按钮可以发音。
  5. 历史词典点击монгол бичиг、кирилл бичиг按钮可以在传统蒙古文、西里尔文之间切换
  6. 历史词典点击pdf按钮可以展开原网站提供的历史词条传统蒙古文转化而成的图片。

数据问题及处理:

  1. 传统蒙古文的正字法与国内有些许差异,大部分已根据国内的标准校正。
  2. 原网站传统蒙古文的编码和字体不完全匹配,故转为栗林均网站使用的编码格式和字体(符合国际/国内标准)。
  3. 删除重复词义。
  4. 对词头进行了部分清理。
  5. 从词库中自动补充了部分原网站没有的传统蒙古文,从app上手动补充了个别。
  6. app提供了传统蒙古文的转写,由其可知单词末辅助元音采用的是ᠢ,而非网站上的ᠶ,ᠦᠭᠡᠢ是作为附加成分(故用NNBSP连接),而非网站上的独立单词(故用空格连接)。保留app的正字。
  7. 保留蒙古国正字法ayi型、字母kh。转写的索引兼容内蒙古正字法ai型、字母k,但传统蒙古文的索引不兼容。
  8. app上的转写方案有些问题,例如ᠻ和阴性的ᠬ都转写为k,ᠰᠠᠢᠬᠠᠨ和ᠰᠠᠶ᠋ᠢᠬᠠᠨ都转写为sayiqan,ᠧ和ᠡ都转写为e。不采用。

已發現但暫未解決的問題:

  1. 原网站没有的传统蒙古文在app上可查询,尚未据其补充完全。
  2. DictTango查询模式高度可能不合适。
  3. 历史词条的传统蒙古文是根据原网站提供的pdf文件的文字层提取的,质量不高。我对部分持续出现的错误进行了替换,但仍存在很多问题,所以大家还是暂时点击pdf,看原pdf转化而成的图片吧。

Changelog:

    1. 处理原数据领属格被识别为-in的错误
    2. 领属格错误: y'yn > -yin,n-un > n-u, -iian > -iyan, -iien > -iyen
    3. 校正app数据中词缀-u元音不和谐、词缀前错用空格的问题
    4. 校正元音不和谐:хүнсэнд
    5. 校正部分短语中蒙古文的拼写错误:өгөх, тэнгэр, мотоцикл унах
    6. -a, -e > _a, _e
    7. 补充转写中缺失的NNBSP:бишүү
    8. uyi > uy'i
    9. 个别小错误:чиньбат > чинь Бат
    10. 解决DictTango查询模式高度不够的问题
    11. 字体打包,西里尔文改为Palatino Linotype字体,蒙古文改为新蒙白,并配合字体调整个别编码
    12. 优化css:设置蒙文的高度、宽度,字体大小,head栏flex display
    13. 动态调整蒙文高度

      2023-7-3: mdx、css

    1. 根据app中的传统蒙古文进行校正
    2. 修正短语中的传统蒙古文拼法:хорвоод
    3. 字体转换为Mongolian White。
    4. 根据当前字体校正найм、саяхан、маяг、намайг、чамайг、шиг的传统蒙古文及转写。
    5. -iin替换为-yin。
    6. 更新西里尔-胡都木数据库
    7. 修复词缀导致的词性判断错误从而导致的转写错误
    8. 修复传统蒙古文、西里尔文互转是GEN的书写错误
    9. 修复拉丁转写gi的显示问题
    10. 提高键位检索的匹配度
    11. css微调:字体、拉丁转写横写等

    2023-2-10: mdx、css

    1. 保留蒙古国正字法ayi型、字母kh。转写的索引兼容内蒙古正字法ai型、字母k。
    2. 修复词义中-ний的显示错误。
    3. 修改了传统蒙古文的匹配算法。
    4. 修正传统蒙古文匹配为拉丁转写的错误。
    5. 删除部分词条传统蒙古文多出的᠔。
    6. 微调css,与其他词典统一。
    7. 修改转写的编码,所见即所得,使用Charis SIL字体,索引兼容栗林均键位(γ、χ)。
    8. 传统蒙古文的字体改为Mongolian Baiti,优点是处理历史拼写更准确,且能正确处理仅含有i元音的词词末字母g的形式,兼容ayi、ai型拼写,缺点是iOs上不能正确处理MVS,且字体偏小,和汉字混排更加麻烦。清文鉴中存在大量历史拼写,Mongolian Universal White不能正确处理。故为了统一更换了所有词典的字体。两者均不能正确处理仅含有i元音的词词中字母g的形式,需选择控制符FVS3。
    9. 在新字体下,校正g形式的错误:'ᠠᠩᠭᠯᠢᠴᠢᠯᠠᠬᠤ', 'ᠠᠩᠭᠯᠢᠵᠢᠬᠤ', 'ᠠᠩᠭᠯᠢᠴᠤᠳ'。
    10. 修正阳性词转写中的g。
    11. ügei用NNBSP连接。
    12. 删除重复词条:магнай хагартал баярлах、тэн тэнгүй ачаа тэмээ малын зовлон тэнцвэргүй амраг сэтгэл санааны зовлон。
    13. 精简传统蒙古文、拉丁转写检索方向的导航栏。
    14. 按词义顺序给tab排序。

    2023-1-19: mdx、css

    1. 词末字母y改为i。
    2. 删除重复词条:монгол бүрээ、сүлд дуулал、багш шавь、багш шавийн барилдлага、тээрүүлэх、бүсрэг яр。
    3. 删除义项的空白标签。
    4. 校正只含有元音i的单词的拼写(考虑附加成分=ece、=iyer、=Ud)。

    "2023-1-13: mdx、js

    1. 删除重复词条:молор эрдэнэ、жуух бичиг барих、бичгийн боловсрол、бичгийн машин。
    2. 清理多余的)和标签。
    3. 校正只含有元音i的单词的拼写。
    4. 解决imgs不存在时js报错的问题。

    GoldenDict显示效果:

    按西里尔文查询МХИТТ词条,унах (同一西里尔文对应多个传统蒙古文)

    按传统蒙古文、拉丁转写查询МХИТТ,ᠶᠠᠭᠠᠷᠠᠬᠤ、yaGaraqu (同一传统蒙古文对应多个西里尔文)

    按西里尔文查询МТТТ,Чингис хаан,可切换至传统蒙古文

    DictTango
    按传统蒙古文、拉丁转写查询МТТТ,可切换至西里尔文,点击pdf可展开原pdf。图片有点小,可用放大功能,或者点击图片在第三方app中打开

    下载:

    字体(与我发布的其他词典通用):

10 个赞

想鼓励一下楼主,你这几天发的几部辞典都非常好,
感谢你改版之后发到这儿
比旧版的更好用,更完善。
最重要是有图可以确认,节省了学习者大量时间,
铭感在心。

我也到B站看了竹城的梦之前发的视频
学到很多,收获很大。
如同有人留言提到的,是网上少见的干货,
认真的人不多见,能做出好东西的更不容易。

或许回覆的人一时没有很多,但请相信,世界之大,好东西只要坚持下去,不会被埋没
我们喜欢的东西原本就是小众中的小众
会花时间在这之上的都是有心人。
你的贡献,会在你意想不到的地方开花结果。

我本来也不知道B站有竹城楼主制作的这么好的视频,
还好你贴到freemdict来,才有机会知道你,并且获得宝贵的辞典。

这里我每天都在,感谢hua的用心经营与奉献
在这里真的学到+获得太多,在此致上我的敬意与谢意。

3 个赞

每天都来,首次发帖 :grinning: :grinning:

愿有所收获!

1 个赞

hua大回我了,所以得说明一下…
freemdict是世间少有的论坛,可以不必登入,不必有帐号,不必累积点数,而能读文章,下载东西的。
我很珍惜。
想想都觉得不容易,这该怎么管理。
特别我们是个free的论坛,很多事情得靠人们的自觉、自爱、自律。

潜水这么久,觉得应该适时表达感谢。
最近看到竹城的梦放了这么多辞典,终于下决心注册一个号
一方面是对楼主,另一方面是对hua。
世界大疫中,还能有一方净土让我每天躲在里头,看看熟悉的人们在讨论些什么,
大家的固执与坚持,其实看久了还有点儿可爱。

我们都是世间的过客,只能在某个小角落留下一点点痕迹,
还是想让这点微薄的存在,给别人带来一点点温暖。

3 个赞

谢谢你的鼓励!

我是从Mastameta的词典里得到灵感的。自从用了他的那些图文综合版词典,就感觉打开了新世界的大门,不仅使用更方便,编辑也更方便。然后我就把经常用的都加上图片了。还有一些排版上的技巧,我也从坛子里的各个词典学到了很多,都用上了。刚刚调试成功了书页的上下翻页,可以更新一波。

我想读日本学者写的那些蒙古学的书,所以最近空闲时间除了修一修词典中发现的问题,都跑去学日语了,b站都鸽了好久好久了,是时候以上日程了 :joy:

1 个赞

我不研究蒙古文,不过看到楼主认真地研究自己喜欢的东西,挺佩服的。

就是要这样自己动手实干,在实践中学习。

刚好看到一本蒙汉词典,不知道对学习蒙古文的书友有没有用,贴在这里吧:

pdf, 242.5MB, ShineMongol Hyatad.pdf
新蒙汉词典. Шинэ монгол - хятад толь. ᠰᠢᠨ ᠠ ᠮᠣᠩᠭᠣᠯ ᠬᠢᠳᠠᠳ ᠲᠤᠯᠶ
商务印书馆, 1998
《新蒙汉词典》编委会(商务印书馆1999年)

1 个赞

这本也很好用!我也做了图文版,等一下发上来

不懂小语种,但是支持楼主,mdx最缺的就是小语种词典(只有日语因为学的人多而且有epwing等可以转制所以多一些),楼主几个帖子一发,蒙古语的mdx就已经比韩语的还多了 :joy:

1 个赞

小语种假如愿意通过英文学,还是可以找到词典的。当然,要做成mdx还得另花功夫。

在annas-archive搜索韩语词典搜不到,但是搜索korean dictionary就有。

korean dictionary

韩语词典最全的是naver,但是不是很好爬取(没有词头目录)

MDict PC 上的js有问题:innerHTML找不到

大部分词条没有图片,所以这个标签找不到,加了个if,已解决
顺手解决了一些其他问题,相见主楼

谢谢!提前祝新年快乐 :pray: