简单比较下几个词典的音标和发音

这几天在整理手头的MDX词典,简单做一下音标和发音的比较:
以下图为主,参照补充主流MDX词典和官方网站,对于抓取网站做的MDX就没再做截图,放不开:
1

一、
对于两个音标词典,Phonetic Symbol更有优势,一是多了个单词音节点,二是音标以英音、美音的顺序排列,而非简单的字母顺序。

Cambridge English Pronouncing Dictionary 18th是大佬重新从CD提取的,音质更好些。从发布帖将两个音标的颜色换了下,与其它多数词典一致。

Cambridge English Pronouncing Dictionary 18th与Longman Pronunciation Dictionary都是采用的D.J.音标,都提供了单词的变形,也都有英美音,而朗文在左下角提供的用法帮助(Usage Help)对搞清发音很有帮助,除了详细介绍了里面的语音符号,还有对多音单词在哪种情况下发什么音做了说明。

剑桥、朗文、牛津这三家以英式英语为主的词典,音标都是D.J.音标,几个常用的版本,如LDOCE5++、牛津高阶英汉双解8、牛津精装9OL与官网一致。

提取自韦氏词典的MW11sound及韦氏词典都与官网使用的是一样的自家音标,但韦氏高阶英汉双解2019却是用的K.K./D.J?

AHD相对版本较少,有个AHD5(IPA)的直接没选,从名字就能看出来。AHD3双解和AHD4-Asicsfree都是采用的三音标标注,AHD5 2017用的与官网一致,都是AHD音标。



二、发音库

Hugh大佬做的英美音库是比较早的,采用朗文里的英音和韦氏中的美音,词条数139282,很适合早期手机空间小的情况。
后来有网友做了五合一版本,数据分别来自Hugh的英美音库(韦氏、朗文补以金山词霸英式发音库)、剑桥发音词典18th(早期版本)、柯林斯发音词典、朗文发音词典3rd、Vocabulary.com。词条数为281569。可惜排列顺序不一致,排版也未优化,没有音标。

Azure大佬做了Sound++,基于Hugh的英美发音库,加上了词频信息。词条数1001725。除了词频外,还有变形词的发音。
再就是The Little Dict这部集合了必应英汉增强版、多种词频信息、多种语音库的大集合。可以具体定义设置自己需要的选项,包括语音库。语音库的各类除了上面提到的五种,还增加了dictionary.com的发音库,另外传说还有麦克米伦的发音库。在演示的时候,发现take词条的语音英音有两个,以为是bug,在核对Collins2.3、CED和官网后,发现在Collins2.3有一个同样的发音。


2 Likes

现有的很多词典的内容的排布,是以单个词典为用途的设计。

而如果用app作为多个词典同时使用,那么每个词典中的音标、发音,就是冗余重复。

可以根据需要合并去除、选择显示、选择下载。

这方面 TLD 有亮点,比如整合了多个词典、可按需加载各词典。

其还可进一步的方向是

  1. 以词典使用为大一统设计,将各词典的各部分数据分开整理。即渐进的拆分一个词典的各部分。
  2. 以词典使用为大一统设计,按需加载各部分。(e.g. 同一个音标没必要显示在各个词典处,现在不动 mdx 可以用 css 去除,但只去除却没有整合,有的词条的发音只有某些词典有,比如我很少看释义的 CALD 竟然有 LPD CEPD ODE 都没有的发音(但只是部分现象,有的词相反)。
  3. 而如果不需要发音,甚至以上考虑都不用关心。
  4. 而释义如果和词典其他内容强依赖,也可以拆分对比。之所以需要多个词典,是因为各定义方法用词不同,有的信息不符合读者的习惯难以理解,或者本身信息就抽象损失的部分不同需要补全。
  5. 最好词典还能支持一键上传 issue,目前词典只有中心式的分发,反馈、订正数据的流程依赖更多步骤的讨论。那么多人重复发现问题真的是必要的吗?有组织有计划的革新各版本、自动显示用户中有疑问的释义词条作为对比和帮助。形成联动的词典。真正做到:为了人民,依靠人民。
1 Like

我喜欢看这个类别的帖子,所以我来回复一下。

ᵻ ticket /ˈtɪkᵻt/ – free variation between /ɪ/ and /ə/

ᵿ unique /jᵿˈnik/ – free variation between /ʊ/ and /ə/

词典发音首推牛津、朗文、剑桥、麦克米伦、柯林斯,各具特色:

  1. 牛朗剑麦都是ESL规模,“发音收词量”(以下同)较小;
  2. 牛津OALD和OED发音有差别,前者单词有机器发音,后者只有单词发音;
  3. 牛津朗文都有例句发音,牛津念(照本宣科),朗文说(角色扮演);
  4. 麦克米伦有其他发音,如引擎声音;
  5. 柯林斯的机器发音质量较好,收词量是母语词典CED,单词变形大多有发音;

此外,还有韦氏、AHD、Dictionary.comVocabulary.com,基本都是机器发音水平。

TLD作者制作的发音MDD统筹考虑了发音质量和文件大小,我用他制作的 “柯林斯+韦氏+Dictionary+Vocabulary” 发音组合,作为取词词库,基本能覆盖日常查词发音的90%以上的需求。
DIY 多功能百宝箱词典 - The little dict

(出处: 掌上百科 - PDAWIKI)

2 Likes