【竹城的梦】BolorToli [蒙英-英蒙, 发音] v.2023-1-2

之前在b站上传过一版。这一版和之相比,重新排版,更加紧凑,对部分词头、传统蒙古文进行了校正,补充了个别遗漏的词。

网上流传的[其他语种] 《AACS 蒙古语英语互释词典》[61861](100531)与BolorToli的数据来源应该是相同的,但BolorToli更全一些。

词典制作者:竹城的梦@b站
版本:2023-1-2
来源:
http://www.bolor-toli.com/
文件列表:
BolorToli.mdx
BolorToli.mdd (音频)
BolorToli.png (logo)
BolorToli.css
BolorToli.js
字体:
1、Mongolian Universal White(MongolianUniversalWhite.ttf):传统蒙古文
2、Setuon Goth 12(SOGOTH12.ttf):传统蒙古文拉丁转写
3、Tahoma(tahoma.ttf):西里尔文
系统中若没有安装以上字体,可在字体文件夹中下载对应文件,PC端直接安装字体,Android端DictTango在"全局显示字体>添加外部字体"中加载,其他版本可以尝试把字体文件和mdx放在同一文件夹下,不要改动字体文件名称
测试环境:
1、Linux + Goldendict 22.9.24-alpha.c2607dbb
2、安卓13 + DictTango v1.6.9.1
数据抓取:
1、通过MongolTol、新蒙汉词典、Bawden、Lessing等多本词典构建了西里尔文单词集,以其为基础对网站进行了广度遍历
2、对在模糊匹配结果中但不在第一轮查询集中的单词,进行第二轮广度遍历
3、补充零星发现的其他未遍历到的单词
基于上述算法,抓取可能有少量遗漏,特别是俄语词,如果大家在使用过程中有发现,希望能够反馈
使用方式:
1、音频的mdd可以不下载,其他功能不受影响
2、将下载的文件放在同一文件夹下,保证mdx、mdd和png的文件名相同,不要修改css、js的名称,再将此文件夹放入词典文件目录下
3、支持检索西里尔文、英文、传统蒙古文及其拉丁转写
4、点击BT按钮可以发音
数据问题及处理:
1、传统蒙古文的正字法与国内有些许差异,大部分已按国内标准校正
2、原网站传统蒙古文的编码和字体不匹配,故转为栗林均网站使用的编码格式和字体
3、删除重复词义
4、对词头进行了部分清理
5、原网站词条分得过细,故进行了整合
6、英蒙方向是通过蒙英方向的跳转链接得到的,并未重新抓取数据
7、补充了部分原网站缺失的传统蒙古文
已發現但暫未解決的問題:
1、三列排版是窗口的百分比,窗口过窄时显示异常,理想情况下小宽度下使用另一布局
2、DictTango查询模式高度可能不合适

GoldenDict显示效果,传统蒙古文(ᠶᠠᠭᠠᠷᠠᠬᠤ)、拉丁转写(yaGaraqu)查询页面(同一传统蒙古文对应多个西里尔文):

DictTango显示效果,西里尔文(унах,同一西里尔文对应多个传统蒙古文)、英文查询页面:


下载:

字体:(与我发布的其他词典通用)

7 Likes

辛苦了,很珍贵的分享!

想知道这个差异大致上是什么

这是一个大工程啊。

蒙古国传统蒙古文的正字法比较保守,最普遍的一是双元音ai ei ui ou中间会保留y。比如ai,历史上本来是a和yi两个音节,但这套书写系统原本没有字母y,只是用一个长牙表示。慢慢地为了与i区分,加了个钩造了y。双元音形成后在这个结构里y又简化成了一个长牙。所以在蒙古国的词典里,经常能看到转写ayi和aii,但标准的应该是ayi,比如看看他们小学教材里的教法。


内蒙这边简化了,直接认为i是一个音节末辅助元音。标准的转写是ai。

二是字母k。蒙古国使用的时候是送气的字母kh。

内蒙这边使用的是字母k。

另外系统性地差异比较大的是近代以来借入的汉语和俄语单词的正字法。剩下的规则就没那么系统了。

各本词典若本身不带转写,栗林均给的转写也不统一。BolorToli自己没有给出转写,而且原网站有些传统蒙古文显示明显错误(编码和字体不匹配)。我的设计原则是有出版图书原文的保留原文,没有的西里尔文按蒙古国正字法,传统蒙古文按国内的正字法。以上不涉及变体。

我写了个python module,先把系统性的差异统一了,再逐步添加细致的规则, 具体的一点有需要的话就调用。在使用过程中发现有问题的我只用修改module,再批量重新生成所有的mdx就可以了。这样就没那么让人望而却步了。

1 Like

感谢详细说明,学到很多。

这在满文也继承下来了(雙元音后面的i是两个长牙)。到了锡伯文又有变化(雙元音后面的i是一短一长)

看到一个满文词,几乎能百分之百准写正确,没有太多例外。
而如果看到不熟悉的蒙文字,对我这种小白就会是一个很辛苦的过程,那叫一个艰辛。
同形异音字,排列组合之多,令人望之却步。
单单是转写出来,查字典就要费许多功夫。
更不消说,相对复杂的语法组织。

竹城楼主的教学视频我还在慢慢啃,基本上是面对已经有基本概念的读者,
如果是对初入门,但是整体语法概念和经验都不足的人而言,该怎么突破初学时的种种关卡呢?
就像许多人学习外语一样,学好蒙古语是我的一个心愿,但似乎总是不得法,
蒙古语的构词如此灵活,发音言文分离,既古老,又迷人,同时也增加了学习难度。

以上的心得与词典本身无关,学习也应该是每个人自己的责任,本来无论如何都应该是自己去突破。
惟楼主的知识让人仰之弥高,心生向往。
见贤思齐,很期待竹城的梦作为学习路上的前辈,之后如有机会分享,能给后来者一些建议。
比如我们应该准备好哪些教材,应该如何往前推进,期盼能获得您的指点。

我不研究这个,不过支持楼主的努力。

Anna’s Archive 上有些蒙古语词典,把链接发在这里,供各位参考:

English Mongolian Dictionary for Kindle
Mongolian dictionary
Mongolian Dictionary of Idioms
Han Mongolian Dictionary
Mongolian Dictionary
汉蒙词典 (第三版)

mongolian dictionary

1 Like

感谢实收兄的宝贵提示,找到好多没见过的书。
还真没想过用蒙古语词典等关键词来搜,一查才知道世界之大。
一直以来受惠于您的交互索引与信息提供,藉此帖表达谢忱!

1 Like

蒙古文也是,手写的话很多人都会写成一个字牙加一个长牙,但我觉得写两个长牙更好看

查字典的话用通配符很方便的,比如goldendict里,可以查[dt] [ou] [ae]之类的,这样只用查一次就能穷尽所有可能,而且输入也很了解,简直不要太适合查蒙文了。哦对了,突然想起栗林均先生转写的一个有点,就是o u的阴阳性是用大小写区分的,而不少软件可以选择忽略大小写,GD默认就是,这样差同形词就很方便。这也是我最初制作mdx时选择这一套的一个重要原因,只不过时间太久之前我给忘了。

我并不是一个母语者,而且网上也有非常优秀的入门教程,所以制作的教程都避开了零基础,这样就是不想误人子弟,也尽量不讲语音。我的语言学基础还不错,所以更多地偏重语法分析。

对蒙文的拼写和识读还没有感觉的话,我觉得最好的是阿迪老师(公众号阿迪制造)的80讲老版,基本上可以学到感觉自己入门、克服心理障碍的程度。这之后就比较麻烦了,因为国内编写的老蒙文教材都不怎么好,属于速成那一卦的,只能用来应应急,真学是学不会的。我采用的方法是以新蒙文为媒介来学习。不用掌握其拼写,当成一个音标辅助就行。北大那套新蒙文教材录音非常好,但内容的话也不太适合自学。相比之下英文编写的新蒙文教材就非常好了,而且好的很多,属于我都看不过来那种。libgen上就能搜到不少。大框架的话比较推荐我在b站讲的那本modern Mongolian,细节的话bayarmaa khalzaa的两本非常好。

语法方面国内清格尔泰的那本是代表,但在体系上和现代语言学结合得不太好。另一本比较全的是tserenpil & Kullman,结合得稍微好一点,但依然是自称体系。想要真的好明白还是得读现代语言学的专著,比如janhunen,另外还有我觉得现代体系下的入门框架搭得最好的Song Jae-mog的博士论文(b站上我大概讲了一半)。这俩读了之后,就会觉得蒙古语的语法不再自己独美,而是属于世界语言体系的一份子,无甚特殊,从而融会贯通。

以上种种,可以展开的有很多,有兴趣的话可以单独开个帖子

2 Likes

感谢高人指路,授人以金针。
十分清晰,获益良多!

初学者算牙的时候,常常被这个两长牙或一短一长弄晕,算得七荤八素…我也喜欢写两个长牙。

真不知道可以用通配符查,好主意,好设计!

我刚刚接触蒙古语时,被最后四个元音弄得哭了出来。发音每本书说得都不一样,甚至还有两两相反的。Khalkha话还是比较一致的,有个比较相近的标准,但是察哈尔话就让人很晕。

以前一位老师是母语者,会说蒙古语,但不懂语法。请教他蒙古语,就像给老人做田野调查…

您愿意分享,是我们的福分。 :face_holding_back_tears:

最新版dicttango会挤在一块,css最好修订一下。

谢谢反馈。网站改版后我重新抓取制作了一版,尚未发布。旧版不再维护。