Mongolian-English Dictionary
Charles Bawden
Kegan Paul International, 1997
制作者:竹城的梦@b站
版本:2023-12-16
这本收词相对丰富,主要偏向现代通用词汇,示例也很清晰。特别是对于现代喀尔喀标准语,在众多非母语词典中,释义最为精确。
数据来源及处理:
- 数据以kindle为主,以栗林均网站为辅。两者的数据来源应该相同,存在明显的OCR错误,但栗林均网站的错误相对较少。问题主要是部分西里尔字母被错误地识别为拉丁字母,绝大部分已处理。
- kindle数据中,副词条被放置在主词条下,而栗林均网站则把二者处理成同一等级。本词典两者均保留。
- 附录部分补充的词义或短语插入到对应的主词条下,补充的词条和正文词条同等对待,区别仅在页码位置指出。
- 传统蒙古文系本人根据西里尔文匹配添加,仅供参考。
- 凡藏语借词,若词典给出了威利转写,则同时显示藏文和转写。来自其他语言的借词,除俄语外词典没有给出。语言名称改为ISO 639-3,放入长方形框内。
- 添加传统蒙古文及其拉丁转写的索引。
文件列表:
- 【2023-12-16】Bawden - Mongolian-English Dictionary (1997).mdx (正文)
- 【2023-5-23】Bawden - Mongolian-English Dictionary (1997).mdd (图片)
- 【2023-8-13】Bawden - Mongolian-English Dictionary (1997).1.mdd (字体)
- 【2023-5-23】Bawden - Mongolian-English Dictionary (1997).png (logo)
- 【2023-12-16】bd.css
- 【2023-8-13】bd.js
测试环境:
- Linux + Goldendict
- 安卓 + DictTango
使用方式:
- 图片的mdd可以不下载,其他功能不受影响。
- 将下载的文件放在同一文件夹下(mdx、mdd、png的文件名可修改,但必须保持一致,css、js的名称不能修改),再将此文件夹放入词典文件目录下。
- 检索支持传统蒙古文、传统蒙古文拉丁转写、西里尔文。
- 原书图片默认隐藏,点击页码可展开图片,可点击上一页、下一页。
- 传统蒙古文的Unicode名称默认隐藏,点击"U"按钮可展开。
Changelog:
2023-12-16: mdx、css"
- 更新新老蒙文转换词库
- 校正部分副词条被识别为大写的西里尔文
- 校正部分因单词和数字分行而为被识别的词头
- 部分词源移回原位:ном
- 删除词义末多余的编号:ЭРГҮҮТЭХ, ЭРГҮҮР, ЭРГҮҮЛЭХ
- 根据Mongoltoli app上的数据调整西里尔文词头的大小写情况
- 手动调整个别大小写:ЯПОНД > Японд
- 手动调整格式:нэгэнт
- 修正部分usg标签格式: gram, jur, chem, mil, geom, mech, anat, Buddh, ichth, biol, arith, zool, hist, san, geol, geog, min, p.n.
- 补充缺失的部分词义编号
- 添加词头西里尔和数字中缺失的空格
- 删除词义首多余的编号
- 更新rus、san标签
- 去除多余的部分dt标签
- 修正部分混杂或混淆d的dt、dd标签格式
- 把部分本该在exEng标签内的usg标签移入exEng标签内
- 将latin标签嵌套在exEng标签内
- 修复部分副词条词义中的括号导致的错误分行
- 修复部分未被识别的例词
- 校正部分混杂的exchange、italics标签
- 合并分开的latin标签
- 改正蒙古文:золиос, хувиар
- 删除附录中副词条西里尔文~替代产生的多余的:
- 删除西里尔文部分多余的inlineCyrl标签
- 修正附录中dd的格式
- 修复部分原数据中标签缺乏导致的排版问题
- 修复部分被错误识别为cmp的usg
- 拆分部分杂糅的dt、dd标签
- 去除部分词头中多余的:
- 补回换行和逗号导致的空格丢失
- 藏文威利转写:rgyatshva > rgya tshwa, zhva > zhwa
- OCR错误: А > A, серо > cepa, У PC AX > УРСАХ, Д > A, Ш.1 > III.1, COPTOOT > СОРТООТ, TOOTOH > ТООТОН, TOOT > ТООТ, TOOX > ТООХ, 1.I > 1.i, 2.I > 2.i, 4.I > 4.i, opuioox > оршоох, uioo > шоо, ore > are, yy > уу, /i > li, ІН > Ш, ІІІ > Ш, ІП > Ш, хар > хар, Л. > n., l.ii > 1.ii, - > ~, m/7. > mil., too > тоо, rapaapaa > гараараа, rapaa > гараа, rap > гар, C > C, Р > P, l > 1, printer/ > printery, л > n, ojirox > олгох, ocoji > осол, xoji > хол, oojib > ооль, U > (~, ’, > ;, chern > chem, ] > ), AA > АА, TA > ТА, AH > АН, HA > НА, OO > ОО, TО > ТО, ОP > ОР, YY > ҮҮ, TҮ > ТҮ, ҮH > ҮН, PC > РС, OР > ОР, XО > ХО, YB > ҮВ, XҮ > ХҮ, a3para > азрага, сору > copy, ilur > (jur, ao > go, щ» > цы, ИГУРАГ > ШУРАГ, спор > chop, фреаг- ance > appearance, too-сгоны > тоосгоны, t. tenuifolium > L. tenuifolium, bof > bot, [A-Z], > [A-Z]., arena r i us > arenarius, ХУТАГГ > ХУТАГТ, Х > X, Rive.r > River, etc.I > etc.), даруулгат 4 > даруулгат ~), JuniperusJ > Juniperus, J, xyi > xyl, yHax > унах, (geo/.) > (geol.), J > j, fiге > fire, tocoh > тосон, ’ > SPACE, 6yc > бус, XAHX > ХАНХ
- 删除栗林均数据中的〖和〗
- 拆分栗林均数据中的主词条和副词条
- 删除多余的J.
- 补充部分缺失的括号
- 修正部分拉丁文的格式错误
- 修正部分also标签、see标签、cf标签
- 修正部分cmp标签的分行错误
- 修改页码错误:давс
- 修正部分词条的编号
- 部分西里尔文和~合并标签
- 修复部分未识别的cmp、see标签
- 英文词义中的bold/cyrl标签改为inlineCyrl, italics标签 > latin标签
- 去掉词义末尾多余的逗号
- 补充个别原数据中缺失的空格:давсныхүчил > давсны хүчил, далантаваарбуух > далан таваар буух
- 补充部分缺失的~
- 删除部分未匹配的exEng标签
- 处理部分p标签缺失、多余的p标签导致的词头划分错误
- 修复部分未识别的词义标号、词义中存在西里尔文和see标签导致的分行错误
- 补回词义中英文和拉丁文之间丢掉的逗号
- 补充个别缺失的词义编号
- 调整部分未识别的词义的格式
- 修改部分词义中的语法用法标签
- 去掉个别词义、词性的bold标签,进而修复其导致的排版问题
- 修复部分副词条大写西里尔文导致的词头识别错误
- 修复部分原数据标签缺失导致的词头识别错误
- 对调原数据中西里尔文和英文错误的标签
- 修复-ын前-被错误替换的问题
- 去除-ын前的空格
- 去除-前多余的p标签
- 处理部分未闭合的dt、span标签
- 罗马数字标签正确闭合
- 增加cmpnobr标签
- 调整部分附录的格式和位置
- 副词条转化大写为小写
- 调整部分专有名词为大写
- 增添副词条词义:хурд мэдэн, за яахав, чадлын хирээр, шар буурцаг
- 删除因分行而出现的-
- 页码:онгон: 259a > 259b
2023-9-24: mdx
- 纠正部分cyrl标签内文字的替换错误
- 删除单词内分行:саатуу-лга
- 纠正部分词头和cmp标签混在一起导致的~丢失
- 校正部分see标签
- OCR错误:xotxoh > хотхон, U > (~, { > (, not. hist > nat. hist, - > ~, ~ > -, CYP > СҮР, iycaM > тусам, TaiBap > татвар, УУУ > УУ, fliqht > flight, ОМ-ІЗО > ОМ-130, MopnHxyyp > морин хуур, ryypc > гуурс, xyyp > хуур, yypc > уурс, yyp > уур, xoop > хоор, ac/v > adv, xohox > хонох, tom > том, зор.игт > зоригт, БАРБЦАА > БАРЬЦАА, 1.1 > I.1, ІІ > II, ёc > ёс, З > 3, С > C, Е > E, bof. > bot., Solsolo colli no > Salsola collina, TOMXOH > ТОМХОН, OX > ОХ, $ > ч, op > ор, A > А, tooho > тооно, tooh > тоон, xomc > хомс, toot > тоот, toom > тоом, tooc > тоос, tooh > тоон, too > тоо, iam > jam, cxrcrox > олгох, [polit.) > (polit.), •» > ~, В > B, hot > нот, cohcox > сонсох, ш/ > йт, Кикипог > Kukunor, osAr > astr, stlrgr.J > surg.), Н > ~), жимc > жимс, mid-die > middle, eartn > earth, іуяа > туяа, Toocoo > тоосоо, Tooc > тоос
- 修复…导致的部分副词条未识别的问题
- 删除多余的空格:ТУ СТАЙ > ТУСТАЙ, UF O > UFO, хуя г > хуяг, r ôle > rôle, 1 8 > 18, 't
- 更新西里尔文转胡都木文数据库
- 更新含大写字母的西里尔文到胡都木文的转换算法
- 纠正部分§识别导致的格式错误
- 纠正部分英文解释中混杂西里尔文、词性或用法导致的分行错误
- 更新部分usg标签:psych, rail, geog, Amer, bot, Man, Chin, phil, com
- 更新部分usg标签的格式
- 删除没有词义编号小写罗马数字时错误出现的None
- 副词条转化大写为小写
- 把ô纳入英文词义范围
- 修正部分没有英文词义的dd被识别为dt的问题
- 删除部分\n转换为空格导致词头出现的多余的空格
- 纠正部分cmp标签的格式错误h
- 纠正部分see标签的格式错误
- 补回部分缺失的空格和~
- 纠正部分主词条、副词条没有分行的错误
- 纠正部分idm副词条分行的错误
- 修正部分嵌套标签导致的词义数字编号未识别的问题
- 删除多余的数字圈编号
- 修正部分未识别的俄文
- 纠正部分词义dt被错误识别成dd的问题
- 将不含空格的满语词源提到词义首
- 纠正部分副词条词头错误:бичиж дуусгах, сүйрч унах
- 纠正换行符导致的~前空格缺失的问题
- 校正部分未识别的副词条
- 纠正部分英文词义括号、“导致的错误分行
- 校正部分未识别的cf
- 删除换行形成的多余的-和空格
- 删除首项词义前多余的编号,调整格式
- 纠正部分副词条中未识别的编号
- 纠正词头被识别为拉丁字母导致的词头划分错误
- 纠正部分bold标签缺乏或包含数字导致的词头未识别
- 纠正部分嵌套的dt、dd标签
- 纠正部分跳转链接中多余的词义编号
- 纠正部分p标签缺乏导致的词头未识别
- 纠正部分拉丁名称单个大写字母被识别为西里尔文造成的词头划分和格式错误
- 补充缺乏的个别词义编号
2023-8-13: mdx、css、Bawden - Mongolian-English Dictionary (1997).1.mdd
【2023-8-13】为重要更新
- 更新西里尔-胡都木数据库:_xin > -xin(' ᠬᠶᠢᠨ' > ' ᠬᠢᠨ'),-in > -yin
- 领属格:n-un > n-u
- 规范css中的竖排显示
- 修复“~”前\n导致的缺少空格的问题
- 修复“ -[а-яөүеё]”型、“[а-яөүеё]+?-”型中词头未替换的问题
- 修复部分俄语借词错误的分行显示
- 修复部分词性显示:/rans, п
- 修复部分usg错别字:xy/、mi/s、Г/ь、onat、frans, hot, m/7., /иг
- 更新部分usg标签:Buddh、xyl、vulg、fig、math, photo
- 拆开部分usg标签
- 删除多余的空格:"191 1"
- 修复网站数据中部分OCR错误导致的短语词头划分错误
- 修复被错误识别为英文的单词:сур, хот, том, хотоо, хар, сар
- 修复部分cmp、tag、num标签
- 修复部分子义项(如ii iii等)同一行显示的问题
- 若原数据中单个引号被识别为西里尔文,改为英文
- 修复词义中БНМАУ出现导致的词头分析错误
- 修复部分单引号导致换行的问题
- 去除部分's前多余的空格
- 去除西里尔文中原数据\n导致的空格缺失
- 修复-ын中-被错误替换为~的问题
- 删除词中-换行
- 修复部分乱码:irer>нэг, б.i>6.i
- 校正了传统蒙古文:танаар, хойд, халаад
- 补充原数据中缺乏的部分~
- 修复原数据中~前缺乏空格的情况
- 更新西里尔-胡都木数据库
- 去掉词义首行首多余的②
- 修复词条编号大写导致的不能正确识别格式的问题
- 修复短语大写导致的词头识别错误的问题
- 修复词头数据中A的存在导致的词条划分错误
- 修复副词条释义中的西里尔文示例导致的错误分行
- 修正dt后的数字i
- 修复部分原数据bold标记缺失导致的cmp标签缺失或词头划分错误
- 修复部分原数据p标签缺失导致的词头划分错误
- 修复部分dt被错误识别为dd的情况
- 错别字:givina, пуужингишг, ПГУУРАХ, харангуи, дугуи, eye I e-race, «• > ~, Ч > ~, c/a > Dd, fru tration, xии > жин, 1I > II
- 修复部分cmp的错误分行
- 修复词义a后的西里尔文导致的错误分行
- 改正标点:‘t > 't
- 部分cmp标签修正为小写
- 修复部分副词条西里尔文词头和词义混杂的问题
- 将被错误识别为方括号的括号改正
- 删除,后多余的.
- 纠正部分附录的错误位置
- 字体打包,西里尔文改为Palatino Linotype字体,蒙古文改为新蒙白
- 优化css:设置蒙文的高度、宽度,dd、dt缩进,字体大小,head栏flex display、页码上下居中
- 动态调整蒙文高度
- 更新新老蒙文转换数据库和算法
2023-7-3 mdx、css、字体mnglwhiteotf.ttf
- 字体转换为Mongolian White。(原字体不能正常显示ngγ_a,多翻比较后更换了字体)
- 部分词性、语言、用法、跳转标签、cmp标签
- 部分词头错误,集中处理了cmp标记错误、大写西里尔字母被识别文拉丁字母导致词头识别错误的问题
- 部分识别错误
- 部分附录排版、重新放置
- 处理部分没有格式的词条
- 藏文拼写lh
- 传统蒙古文гороо гороолох халмаг байцаа хорвоо
- 补充蒙古文тэнгэр
- 讲有多项dt或dd的条目中位于最末端的词源调整至词义首
- 藏文их монлам
- 修正tab标号的位置
- 修正第一项词义的标号①被错误识别为词编号i的问题
- 校正部分例子中被错误识别为大写的西里尔文
- 更新西里尔-胡都木数据库
- 修复词缀导致的词性判断错误从而导致的转写错误
- 修复传统蒙古文、西里尔文互转是GEN的书写错误
- 修复-导致的副词条显示问题
- 修复拉丁转写gi的显示问题
- 提高键位检索的匹配度