英语各词典的比较——从MWO的错漏部分开始

点我展开温馨提示:
  1. dependency
  2. 辨异:思序和文序。clearation of two different concept: order of think or article
    1. 前因,后果。中有法。思为文,文以备览。
    2. 前杂,后简。前之杂试,所以我所自然法,试后知歧路,,终至正途,实为必要。表现为混乱但错误尝试的改正能直引正确,后利于阅读查找、但不利于源代码级别的方法本身的产生、迁移、重塑。各有优劣处,大家按需选择读或不读、全读还是选读、选这还是选那。
  3. 事物分主次、异同、相互关联制约协同。故同父类的、同形式、同文字数量不是决定最终的同等满足个人的需求的关键(自然,异,也同样。(但异的事物可以因其他的异可以决定))。进行描述的几个点与点之间的比较不能以这三个“同”作为质量标准来衡量。以为有优点就是好、东西数量多了就是好、相同形式就是好,而没有看到其贡献的价值多少、其消耗的精力、其缺点带来的破坏到什么程度。这是幼稚、简单、偷懒不思考、拒绝成长,应以价值的投入产出比为根本衡量标准进行排名选择或丢弃(将已建立在错误上的表象上的直接反射训化的喜恶控制系统丢弃掉、替换、嫁接、修改)。
  4. 就算暂时因为讨厌一个事物而想否定它觉得它没有优点,也要写下"优点",然后作为目标找它的优点,勿让喜恶蒙蔽了真理。
    1. 客观的分析问题可以让自己掌握更多信息,因为建立在简单的直觉上的喜好往往被表象欺骗,它就像尿不湿一样完成了历史任务,现在是成长和过去说再见的时候了。
    2. 不能改的本性,就加以先发额外的措施来干预利用而不是与之抗争自我消耗。
  5. 内容动态调整中,可能不一样。

本帖记录下各词典在查词时的不同表现对比,旨在大家讨论、批判,后来者可有所借鉴、选择、省时、避坑。

本帖记录下各词典在查词时的不同表现对比,旨在大家讨论、批判,后来者可有所借鉴、选择、省时、避坑。

本帖记录下各词典在查词时的不同表现对比,旨在大家讨论、批判,后来者可有所借鉴、选择、省时、避坑。


点我展开本贴起始原由:
  • MWO信息错误记录
    • Liu Shao-ch’i
      • 去世日期:通过百度、维基、中共党史网交叉验证,1974 应订正为 1969
  • MWO无用信息
    • Liu Shao-ch’i
      • 字典推荐的相近词条Litvak, Litvinov, litz wire, Liu Shao-ch’i,Liu Xiaobo, vability,livable

由此MWO在该词条中质量很差,推荐相近词条的功能在该词条中是垃圾,纯费人时间。

注意是局部,而且是50万词条,50万分之一的局部,不是整体MWO,整体MWO是什么质量会在后面越来越多的词条的比较中大家自行分辨。要是免费的MWO后面的比辆就是类似水平的话,那就直接删了它。。

点我展开本贴起始原由详细版、思考顺序版:

前置预备:MWO, MWU => merriam-webster Online | Unabridged

后文诸如此类缩写请自行搜下论坛,不再赘述。

由于在词典中打出liu, MWO中有Liu 𣥂奇词条

看看这个MWO什么质量,该页面

1898–1974 Chinese Communist politician

而去世日期1974在其他多个信息源是1969.

推荐的相近词条Litvak, Litvinov, litz wire, Liu Shao-ch’i,Liu Xiaobo, vability,livable

没有多大相关性的词典内容,是一种噪音,是浪费读者的时间,一看是免费的MW online,好吧,权利和责任同在,他不获利,则我读他是我自己的选则,浪费时间是我的责任、自己的问题。

check items
  • word
    • suet
      编译者序

翻译词典是件苦事,越认真越苦,回想二十年前参与编译《An English Reader’s Dictionary》(《牛津英汉双解词典》后易名《牛津进阶英汉双解词典》),译者多凭自己的语言知识参考其他英汉词典进行翻译,不免产生一些错误,如将 suet 译作“板油(羊牛腰子上的硬脂肪,可作烹调用)”,又如将 gear “排挡”误作“排档”,校订时也未察不妥,后来知道只有猪的体腔内才有“板油”,而“挡”与“档”二字的形、音、义皆不同。英汉词典中似是而非的“混血词”和“混血句”不胜枚举,且以讹传讹、为虎作伥,愧对莘莘学子。

此次翻译《Oxford Advanced Learner’s Dictionary》,要求原文要懂,译文要通。原文要懂,就是要求译者充分理解原文,先将原文定义准确译出,帮助使用词典的人理解原文,然后再将汉语对应词置于定义之后。对应词力求贴切,宁缺勿滥。在定义之后的示例中,选用适合示例中的词语而不机械地套用定义译文中的对应词。这样既丰富了定义的对应词,也可避免初学者误将词典奉为圭臬,从而可进一步扩大思路,达到本词典抛砖引玉的目的。译文要通,就是力求汉语词句规范,在汉语工具书中有据可查,包括人名和地名用字、数字用法等。根据原文需要,译文也相应或文或俗,不避讳粗鄙词语,但尽力避免使用方言词语。英语习语(idioms)的翻译也和一般词条一样大多只译定义,但有些则仿照汉语谚语形式译出原文习语词组而不取貌合神离的汉语成语。原文示例词组甚多,一般均译成对应的汉语词组而不译成句子,这就避免出现一些拖泥带水的词组,算是无可奈何的遗憾。使用本词典的人在组词成句时,幸勿照搬这类译文词组示例。有连接号的词条中的示例多为表明构词方式或另有独立词条,一般不译。英语中新的词语或表达方法,在译文需作创新处理时,均经反复推敲使之符合汉语词法和句法规律。英汉词典中的汉语要达到汉语词典的水平,编译出名副其实的英汉词典,这是我多年的夙愿也是工作中的努力方向。

本词典翻译过程中,喜见《汉语大词典》前几卷相继出版,《汉语大字典》、《简明不列颠百科全书》、新版《Oxford English Dictionary》等汉、英、科技等工具书先后问世。感谢众多无声老师相助,本词典的译文有了可靠的依据,减少了许多错误。通过学习得知汉语中的“肉豆蔻”(nutmeg)是木本,“小豆蔻”(cardamom)是草本;英语中的 stepbrother(既不同父又不同母)与 half-brother(同父异母或同母异父)不同。又如 except 若只译作“除了”,容易产生歧义。因为“除了”可用于“除了他,我们也去”(包括式),也可用于“除了他,我们都不去”(排除式),还可用于“除了吃就是睡”(非此即彼)。本词典处理为“除了(某人[ 某事物 ] )之外(表示所说的不包括在内)”,从而排除了另外两种歧义。

tell me about it 在各字典的比较

tell me about it——idioms 的子类(父集)之一

什么是子类(父集)? (点我展开)
  1. 从事物的数量来看,分类的父类比子类的数量少,所以1对多,所以父类叫父类,而且基于增量思维,即从一物的概念作加法得到新概念,则该顺序的先为父,后为子。如,男人是人。人是父类,男人是子类。特殊的点有

    1. 分类可嵌套,如我是男人,男人是人。这里的是是“属于”,而非1对1相等。
    2. 子类可以是单个事物,如我是男人。
    3. 子类可以是单个属性,如我有红发、蓝眼(红发、蓝眼是我)。
    4. 以上的子类可作为父类,可以重合、反向,一般谁点据共同点,可以1对多,就是分类父类名。有兴趣自行尝试组合。。不过为了交流方便,大家的分类本身从少到多,其对应的事物数量由多到少这么个顺序。如界门纲目科属种,是通用惯用的,你非要研究会飞的生物为一组,那么可能会和原体系交叉重叠,注意区分就好。
  2. 从事物的所含信息的数量来看,分类的子类比父类的信息的数量更多,所以多对1,所以子包含父,子类相对父类,是父类的父集。父类是子类的子集。

tell me about it: (对对方所说的表示认同)我深有体会!我再清楚不过了!!我比你知道的多。还用你告诉我?

  1. 正常文字理解:(我不懂)好好给我说说这事。

  2. 加上声调、语气:调侃、反讽的。则意思反了,表示这事我知道,所以你用得着跟我说?这事(还用)你跟我好好说?我早就比你知道体会的深多了!我太清楚我太懂了!你说得太对了。

  3. 要素:别人吐槽糟糕的事,自己早有体会,讽刺事里的人(物)的槽糕、认可同意说话的内容(认可对方)。

各词典排名

  1. OED 100分(以OED为基准量,为100分,其他词典相对加减分,很主观,出现顺序按公司)


    OED 包括:

    1. 习语所在的词的释义处的链接,方便查看同义项其他习语。+10分
    2. colloquial, 书面语看不出语气,只能有损记录为文字。 +10分
    3. 来源US,所以在UK,可能用这种习语会尴住。+10分
    4. ironic rejoinder。点题,此信息是理解这句习语的关键。
      1. 链接起本义和引申义,少了这环就难建立起引申义的理解。本身这应该就10分,但,别的词典不写明的说明这个信息点和其他不一样易懂,值更多分,多多少?其他词典越少了这点,这点就越值分。 +30分
      2. 说明对方所说的内容要讽刺,不是夸的或中立的事,讽刺的东西会是好东西? +10分
    5. agreement and understanding。引申义,最终要表达的功能。+10分
    6. 多个简单同义短语,进行场景感觉的认知链接。+10分
    7. 多个例句。+10分
  2. ODE 90分

    1. ODE一反常态的比OED还精简,+10分。
    2. ODE没有例句(lexico_uk),-10分。(不知道其他时间的历史版本如何,比如ODE_living的FF版)
    3. 无同义短语,-10分
  3. OALD_10th 85分(不及格)


    OALD_10th 的吐槽:

    1. 优点
      1. 例句发音,听感记忆点远大于纯视觉的文字(而非听大于视)。+10分。
      2. 例句发音有一丝丝的不平常的语气,但不注意听不出来。与之对应的LDOCE 5的例句更明显听出来这是讽刺。+5分
      3. 分类是“Opinion and argument", 可知跟意见的同意反对有关。+5分。
    2. 缺点
      1. 缺少关键的语气反讽要素:没有解释出这反常的意思为什么凭什么是这么理解,难记忆。-20分
      2. 缺少所说之事的要素:即对糟糕的事的同意认可,而不是什么事都适用。比如好事、欢乐的事的同意就不能用这句话。(你也可以用,就是有点奇怪,别人开心的跟你说,你讽刺人家。。) -20分。
      3. 了解的程度太宽泛:是认可同意、加强讽刺话里的人事;而不只是understand(知道、明白)了。 -10分。
  4. OALD_4th 0分,没有该短语。

  5. MWU 0分, 论坛版搜不到该短语,可能抓取不全,可能没收录。尝试查询tell,无果。

详细思考过程请点我展开

同一个意思选哪个词?

  1. 所以从人的语言习惯用语,选"分类"
  2. 从数学、思考、准确的角度,选"集合".
    但出现任何一个,都应是同一个东西,而不是想到这是"俩词"

前置准备:

  1. idiom,下个标题中的与其字面意思不同、含有特殊意思的习语
  2. idiom 在理解时有其他意思,即1对多映射,上面的1对1映射的含义是存在,而不是唯一存在,不能画等号,同样,相同的含义也是1对多映射到词语、词组上,习语也可以用非idiom的存在表达。简单化问题,用单一的1对1的模型,结果就是错误、生硬,当然,错误往往是由其他好处所迷惑,比如不费劲。

idiom:Tell me about it

  1. OED, explained it perfectly!

it includes strange words, but it’s OK, i can copy the text into translate.google.cn.

The point is that, by the explanation from OED, I UNDERSTOOD why it means “还用你来告诉我?当然啊!说的对啊!我深有体会!你不说我也有同感,就是就是,对吧”

OED告诉我,这是反讽,意思是,现在你跟我讲讲?语气一夸张,则內容就是反过来的(用得着)你跟我讲讲。所以这句idiom 是非正式的口语,因为重要的信息的“取反操作”,是由声音的调的反常夸张来表达的,不是由词句本身的信息表达的。就如同美剧“别对我说谎”,lie to me, 来骗我呀!骗我试试。正因为如此,tell me about it 若是正常语气,就是字面意思。比如CCALD中的例句“And I won’t tell any of the other girls anything you tell me about it. I promise, cross my heart.”。还比如LAAD3th中的例句“I’m astonished that you didn’t tell me about it!”

  1. MWO?

MWO 讲了一部分,但没讲为什么我知道、己经经历的,想要回应赞同的不好的事这个意思是怎么、凭什么用"tell me about it"来代表的。这只能让我硬记,毫无关系的硬关联,缺少中间环节。

  1. LDOCE

LDOCE同样有MWO的这个缺点,还缺少了这是回应别人的意见这个信息。但好处是:

  1. 例句发音,包括语气的夸张。
  2. 对要回应的内容做了详细标志的限定:不好的事

  1. OALD
    OALD在这些点上马马虎虎,亮点在于分类能表示这条目是赞成和反对相关的,而OED在义项中自带这个信息。
    其他的,有例句的发音,但是英音调是普通的,像没吃饭一样没力气。倒是美音的部分语气很像人。。

  2. MWALD
    马马虎虎,亮点在于informal 的标记,乏善可陈. 不截图了。。

  3. ODE

ODE和OED正好得一块用。。在这个词条的定义,ODE比OED强,OED强的部分是给了类似同义句。

  1. 其他词典

一来有的词典没搜出来这个词条。其中我奇怪的是MWU怎么没搜出来?
二来我本身用的词典数量少,可能其他词典更好的定义,欢迎补充。

1 Like

单词的子类(父集)之 the 在各字典的比较

点我展开选择the的原因

解决问题要从问题适合的方法,而不是自己己知的、熟练的方法。
- 从A-Z的顺序是为了快速跳过无关内容,是词典用来方便查询的顺序,但不适合学习顺序,会重点不分。
- 从词频的顺序处理词条是为了一学能用到的更多
- 从目的场景顺序处理更能避免无关信息,收效短期明显、交互多反馈即时更加强记忆。

“the”

语言是用来标记映射世界的.

基本形式有存在,to be,不存在,缺失,not to be
基要单位有建新符号来1 对 1 的映射信息,或合成己有符号来表达新信息

表达信息的过程有2种

  1. 从无处加
  2. 从任一减

所谓分类,如 determiner 于 the, 就是实体数量的一对多,一包多;而在信息量上则是少对多,一被多包含,集合的嵌套。

the 首先有determiner 包含的信息,我就不得不去查一下collins cobuild determiner的 分卷,不然我不知道它包含了啥通用的信息,更不必说其自身特有的信息了。

查完后再更。

在为了弄清语言的意义,以对应到自身感受、让自己明白的过程,需要借助好用的工具。

于是各种词典就是这种好工具,但即使是众多有名的词典,也可以分高下,即相对的好坏。

在为了标记信息,其意义、其形式。其与其他的关系。从词的层面开始,如"the".

使用什么词典呢。

有很多筛选方式(化多为少,避免相对自己的无关信息的输入、浪费时间)

  1. 目的,如BrE和AmE,要是去英国留学就不用理睬AHD, MWU了,如理解用英文还是翻译成中文,如口语还是书面工作,如考试还是社交,如专业还是通用。如文学性还是简明,有趣性还是严谨,对象是谁。。。短时还是长期,多轮浅到深逐层加深还是一劳永𨓜?

  2. 词典本身:在自己需要的前提下,一个词典的好才是对自己的好。而如果不需要,那其实它就没有吸引力。而为了节省思考,会直接定义成“不好”。所以经常有人和人撕逼。。实际上,人和人的意见不同就像人的长相不同,吃的菜不同一样正常。因为意见不仅是物的描述,更是你和物之间的关系反映。

    1. 词典本身的实力:牛津,相对应的国内外小作坊,就很难出精品,容易误导人,而人的特点,学了错的再改习惯改成对的,比一开始学准确的更难。如人一旦对词建立简单模型,一对一(词对意),反向一对一(意对词),而校正机会又少,那就更难了。所以要试,那就从最有钱的词典公司开始试,再用这个方法,从这个公司最有实力的拳头产品的子部门的开始试,什么OED,不适合?那就ODE,还是太难?那就OALD
    2. 口碑。如ALD的牛津、朗文。从各位的使用经验、各位的mdx的制作,热度高,为啥?好用啊。
    3. 选分为好几种,选先看和后看,选看和不看等等。所以有名的可以当备用啊,可能有很多小知识这本讲了,那本不带。所以什么 Oxford, Merriam Webster, Cambridge, Longman, Collins Cobuild, Mammillan, AHD等公司的ALD, unabridged, living, essential, Picture, BrE&&AmE, thesaurus, phrasal verb, collection, idiom, origin, slang都可以当备胎。备胎还可以分层级,带例句语音的弄成一组,可靠性低的分为一组(比如各类人人可编辑的在线词典)随着词典越多,可能精力跟不上,那就挑常用的放在默认的组,其他的疑难杂词的放一组,就当没有他们,需要他们的时候,他们再出来,这样自己平常不会觉得杂、不可靠、累等等。

要点,不要只看一点,要考究多一点,多想想为了什么,想想数量多就好吗?数量少就好吗?想想几十个出名的词典,多试就好吗?试什么?怎么衡量?

再提供一个词thesarus.

读了OED才知道,THESAURUS的意思类似宝库、宝藏。对应到词典那就是百科、宝典,再专指的化怎么个宝法?就是同义比较,是用意义、目的、功能作为集合、分类的名,包括各种词,联结起来的集合关系,是释义到单词的一对多,当然比平常只包括单个单词对应多个释义的词典更全面。由此thesaurus的几个意思其实都好理解了,从词讲就是同义词,从义讲就是功能,扩展到其他领域就是分类词,其实是一个意思,宝就是有什么用,能够满足某个什么用的一堆东西,可不就是同义、同功能的词,除了语言这个方向,其他领域的多个事物按照某个功能划分,于是就成了分类、索引。再看同样是宝典,为什么有时是百科?因为所谓的宝典的主要义项变化了,以前宝典就是内容丰富的百科全书,而现在的宝典则指同义词反义词在功能为首的分类索引下的一对多关系的词典。

OED再展开show more, 可以看到thesaurus 来自 threasure…一个还作为宝,另一个常用为功能的一级索引,再详细就是词的二级解释了。而宝库、金库、财库这个含义,我想到出土的书墓,知识不就是财富吗。

这样理解了一个词,不比把thsaurus和同义词词典1对1 对应起来好记多了!

那么关于单词的解释,是1词到多义,可OED没作1义到多词的分类啊!所以thsaurus词典选什么?

  1. LDOCE? 自带了一部分word family(同词形的不同词性的变体),以及论坛的修改版ACTIV的一部分。
  2. Macmillan thesaurus, 这个是真是专业,几乎每个义项都带了分类索引。

我没看到Macmillan thesaurus前,一直以为LDOCE自带的很好,但选择面多了,才知道一山更比一山高,术业有专攻。

那么就此为止了吗?牛津的thesaurus呢!

3 Likes

在下愚钝,这么图文并茂的帖子,看了两遍还是没整明白 :sweat_smile:

1 Like

你不理解我,说明问题出在我的表达上,这点我是有自知的。。

请问,哪些部分?

下笔千言是好事,如果能增加点条理,照顾下理解能力差的小伙伴就更好了 :joy:

1 Like

感谢你的反馈。 :upside_down_face:

基本是按照时间顺序记录的想法,没有论文的多层简介、分类索引。。

有些无价值的尝试保留了下来,有些在修改中。叉路的尝试对于最后的结果是有排除作用的,没有叉路的尝试,也就不知结果为什么一路顺风变成了词典上的“标准答案”。这是方法的具体描述,所以信息量会大点,压缩的话需要精确用词,你懂的,我英语还在摸索,汉语也不想精进了。。。所以暂时水准只能多词进行限义。很多中文用词是因为一个词有多义,所以多写了几个同义词,取它们共同包含的义项。

还有一些我也很费解,认识在不断的变化中。我觉得这种真实的详细的想法比直给答案包括了更多的可用的方法,就全暴露出来了。

主要用的词典多,对他们的使用的特点也多。同样一个词,词到义的理解本应建立准确的链接,而为了简化信息量造成的损失,在初级够用的时候没问题,在更大的场景中遇到了其他意思,更难挂钩。说明一开始就是妥协,我不愿,所以要从本义出发再剪枝掉古义、不常用的义,再链到扩义,如thesaurus, 这样再扩也是对原来认识的扩展而非弃用重建。这样也会添加、还原出很多信息。也就是在OED上再扩。这样也会增加信息。

多谢你的提醒,我会再修改为tree方便内容的检索,再把原码保存成默认折叠的show more.

Thanks again

1 Like

text_01

各词典的使用技巧

  1. 分类。根据需要来分类
    1. 如:MWO,AHD5可以有很多分类方法:按出版社分,按单个还是多合一词典分,按收词量LIVING 还是UNABRIGED,还是CONCISE分…那么在文件夹层面,它最被需要的最重要一条是什么,想起这个词典最特别的点是什么,就按这个分类。
      1. 所以文件夹层面,可以混合多种分类方式,MWO是AmE还是MW还是living or contemporary? 我用它就是因为有时候搜不到美语词、句,所以它是垫底用的,而不是专门搜AmE,也不是MW还是OXFORD.那他就是big那个文件夹。这样修改文件很快定位。而LAAD,是ESL中的ALD,是AmE,但是我最需要的是它的例句发音,所以把它放在audioWord文件夹。
      2. 而在字典层面,因为不受文件夹只能有一个位置的限制,在字典中可以有多个位置,那这时就可以分很多组,全部是组1,查词优先的是组2,看看发音的是组3等等这些组为了方便或快速等目的,可以每个词典都放多个位置或者唯一好区分。
      3. 在不同时间阶段、步骤中,如收集试用时按照ALD,或OXFORD进行。

单词:FLIP

ODE 各版本

  1. 新牛津英汉双解 PDF 版

  2. ODE2021

  3. LEXICO.COM UK

可以看到牛津做的免费版LEXICO删除了内容,而且仅是这一个释义就删了2个信息,更不必数其他故意的大量阄割!而论坛分享的版本是内容最全面的!中文双解版本的优点是中文,英文部分高不成低不就。

LEXICO 只收集、展示部分信息:意味着读者只知一而不知二,只能肯定某种存在,而不够全、不能否定错误存在。如这里的flip over 可后跟物,也可后没有物,但LEXICO只有第一个。

还有MWU, AHD, COD 等,没有再深入比较选择的理由,事实是各自有优缺点。

尤其难能可贵的ODE两个版本、OALD_4TH、 COD的中文翻译,同一词典内有的词条水平高,有的表现平常,得互相验证,非得要选一本,就用ODE的online + 中文双解2nd,一前一后,都是文字版,体积也能接受。在达成目标的同时,发现有不够的情况,再寻求去添加其他词典。

至于为什么用中文,因为纯英文解释并不能全覆盖词的所有重要信息,无法链接到由中文建立的过往的生活经验。

1 Like

象我这种的上网就扯个淡求点资源抬抬杠,看你老兄这个正儿八经研究问题,有这股子劲几本硕士论文都整下来了,拿顶帽子也就顺便,何必混论坛呢 :joy:

1 Like

建议非常有用,我好好盘算盘算。

主要受论坛的帮助颇多,就把自己遇到的坑记录下,方便后来的人

1 Like

论坛的问题是,自己爱怎么写怎么写自由自在,碰到象我这种普信的杠精直接怼回去,如果在学校就不一样了,各种的规矩要求,不按规矩来就是白忙活,弄不好老师还要骂人 :joy:

多发发,这个比看天涯带劲