[协作接力2.0] Longman Active Study Dictionary 5th 同类词中译

省流:这是一个把双解词典纸质版里的中文译文搬到英文电子版的项目。目前(2023-09-08)第二阶段还在进行中,但基本已经停滞(OP本人对是否有必要完成这个项目产生了自我怀疑:joy:),只建议有充足时间和精力的同学参与。如果后续所有数据录入完,我会把它更新到成品中。

现在最新的成品版本仍是2022-10-13更新的:FreeMdict Cloud百度网盘 请输入提取码


以下为原帖内容

协作接力第一阶段——释义中译(已完成录入)

初步匹配的效果比较理想,所以在这里发起协作接力。总共35651个释义,匹配到了33802个,只剩1849个需要录入,我感觉只要这个论坛不倒,这个接力项目一定会完成。:stuck_out_tongue_winking_eye:

前情:【过时,请勿回复】Longman Active Study Dictionary 5th 例句中译版

附件是这两天的所有成果。如果你觉得这本词典不错想要完善他,欢迎加入协作接力。我估算了一下总共需要十几个小时吧,几个人分工,负担不会太重。我在词典里放了个简易的导航栏,可以提高一点工作效率。

要参加的同学请在此贴下回复承包的序号范围(在M0001~M1849之间),先占位,以免重复劳动。

也可以先领10个体验一下,不限时间,随缘协作。


lasd.mdx (8.9 MB)
lasd.css (16.6 KB)
协作总表:FreeMdict Cloud

作为参照的朗文进阶英汉双解词典可从此处下载 Index of /Recommend/lasecd5_p/ver1/online_img_ver/


以下序号已领取:
M0001~M0402
M1696~M1705

第一阶段小结

我们花了三天时间完成了所有1849个释义中译的录入,其中1728个来自LASD5繁体双解版,剩余121个采用了LDOCE和其他词典比较接近的释义。(每个释义的来源都标注了出处,可放心使用)
感谢各位的协助:@mdict6 @6lj6 @Impact @xliley @alexpeng @pesticide4 @syszzf @medp7060 @有你真好 @Fince …… 同时感谢 hua 指导我们使用cloud.freemdict 平台共享协作数据

在录入中译的过程中我们也发现了其他问题,并尝试解决了其中一部分:
#26 6lj6 发现部分音标中有乱码。——已解决
#34 mdictfan 指出这本词典的动词vi,vt标错了。——在#125 medp7086 的帮助下修复了1157个intransitive标签
#105 Fince 发现pointed例句译文错误,后来 #108 又发现pointed的释义也有错误“a direct way”变成了“an indirect way” ——手动修复了此处文本错误,但我们有理由认为这本词典的其他地方还存在类似文本错误,虽然我个人认为出错的范围应该不大 #110,但大家使用这本词典的时候还是要多加思考,遇到有疑问的地方可以对照其他词典。


协作接力第二阶段——Thesaurus(同类词)

开启第二阶段是为了给想要完善这本词典的同学提供一个可行的途径,至于能不能完成,具体什么时候完成,真的是随缘啦。

Thesaurus概况

在LASD5电子版词典中,Thesaurus的结构主要分成thesbox、section、exponent三层

可能是为了便于阅读,LASD5电子版词典大量复用了thesbox的各个部分。有时候会把thesbox拆散了重新组合,或者提取section中的几个exponent组成新的section。复用的花样挺多的。而纸质版的词典受限于篇幅做了一定的精简,基本上不存在这种重复的内容。这就导致了实际上电子版中有的thesbox,大多数在纸质版的相应位置是空的。这两天为了找对两者的对应关系着实费了不少脑筋。:smile:不过也对电子词典和纸质版词典的差异有了更多具体的认识。

整本词典有10217个exponent,经过整理后,得到了3033个独立的exponent,这意味着需要手工录入的释义数量也是3033个,比上次粗略估算的4963少了很多。同时我也把相关的4755个例句一并提取了。

后来又发现有403个exponent有可能是电子版独有的,纸质版删减了。(我把这部分内容排在协作总表相对靠后的位置,等有时间再细找,不过最后可能还是会因找不到译文而不用录入)

预计工作量:thesbox释义中译需要二十多个小时,相关的例句需要四十多个小时。

如果要完成所有的释义+例句,工作量是上次的三倍多,若只完成释义部分则相对轻松一些。但同类词专栏的内容比较集中,会比上次省很多翻找的时间,估计录入速度应该会快一些


参与协作需要下载专为此次协作制作的mdx和css:
lasd-t.mdx (870.4 KB)
lasd-t.css (19.2 KB)

作为参照的朗文进阶英汉双解词典可从此处下载 Index of /Recommend/lasecd5_p/ver1/

协作总表还是之前那个文件,我在内部新建了一张工作表 FreeMdict Cloud


中译录入画面预览:

35 个赞

支持。

如果访问 freemdict cloud 没问题的话,也许可以考虑使用协同编辑哈哈,我在这儿给一个 文档链接:FreeMdict Cloud ,没有授权的话只能预览,想要在线编辑的同学可以发 cloud 的用户名,我加进可以编辑文档的用户列表中,然后在你的文件列表中点进这个文件,就可以编辑了。

也可以试试其他在线编辑工具,石墨什么的。

1 个赞
历史提问

image

请问这个帖子要做的是什么
就是粘贴我示意的截图上的 蓝色的部分吗>六角括号〔〕要保留嘛,还是可以用中括号[]
遇到了bean词条 kidney bean 翻译成菜豆,而切图5上是芸豆

如果是的话,我领一份吧,就当刷单词了。

我从101开始写,先占位101-200吧 【已完成】

2 个赞

是的,就是补全1849个新增的释义中译。一楼的mdx和css是最新版的,输入第一个词后只要按导航栏的左右箭头,就可以在内置的词表间顺次跳转。要是在电脑上可以用离线版的朗文进阶做对照,反应速度会比较快些 Index of /Recommend/lasecd5_p/ver1/

@hua freemdict cloud我这边加载比较慢,但多等一会儿也可以打开。我想申请在线编辑,用户名Sunny1

3 个赞

应该出现在你们自己的文件列表了,你们点进去试试? @mdict6 @Sunny1

1 个赞

翻译主要参照《朗文进阶英汉双解词典》切图版第五版(前面有提供下载链接),这本词典就是LASD5的繁体双解PDF,因为是mdx版所以比较容易快速查询比对。

LASD5简体和繁体的双解纸质版中文翻译略有不同,比如人名地名,还有一些用语方面的细微差异,我之前在录入例句中译的时候,遇到翻译风格差异比较大的都会去查LASD5简体双解PDF,并以简体版的为准。也可以不用这么严格,都是官方出品。

刚才截图的时候发现图中的例句其实在繁体双解版里有对应中文,当时漏掉了。打算再把那一百多句机翻的再重新检查一遍 :sweat_smile:

3 个赞

啊,我以为那个是简体的。。原来繁体版本已经有数据了。

我发现它翻译的不太贴切啊。

拿这个词举例子:

百度百科的解释

阿喀琉斯之踵(Achilles’ Heel),原指阿喀琉斯的脚后跟,因是其身体唯一一处没有浸泡到冥河水的地方,成为他唯一的弱点。阿喀琉斯后来在特洛伊战争中被毒箭射中脚踝而丧命。现引申为致命的弱点、要害。 [1]

阿喀琉斯,是凡人英雄珀琉斯和海洋女神忒提斯的爱子。忒提斯为了让儿子炼成“金钟罩”,在他刚出生时就将其倒提着浸进冥河。遗憾的是,阿喀琉斯被母亲捏住的脚后跟却不慎露在水外,在全身留下了唯一一处“死穴”。后来,阿喀琉斯被帕里斯一箭射中脚踝而死去。后人常以“阿喀琉斯之踵”譬喻这样一个道理:即使是再强大的英雄,也有致命的死穴软肋

几个关键词:

  1. 要害(多义取其1,所以可以)
  2. 软肋(程度不够深,因为要致死的死穴VS弱点受伤的软肋)
  3. 死穴(这个个人觉得更贴切些?)
  4. 致命弱点(这个翻译意义更准确,牺牲了简洁性和文学性)
  5. 致命伤(多义取次要不常用的义项,而且其主要释义是已经产生的伤,相当于多了额外的限定条件)

我们要不要改一改释义,改成

  1. 简洁的一个释义:死穴,要害
  2. 准确的释义:致命的弱点
  3. 借助其他词已有的性质集合进行加加减减的理解:比软肋程度更深
  4. 把原文的致命伤这个四不像的解释删掉。。
1 个赞

不如加details折叠标签summary写编者

2 个赞

加了,应该出现在你的文件列表了,你可以试试编辑。

1 个赞

LASD4的翻译是菜豆,能匹配到就直接采用了。所有译文都去查LASD5需要非常多的时间。

新版旧版都是专业译者写的,他们起码不会故意犯错来误导别人,我觉得都可以接受。要是发现新版的哪个翻译更好,正好可以借此感受一下词典译者的纠结取舍,小语境翻译很伤脑筋的……


词头数量不是很多,OCR可能没有效率上的优势。 而且OCR之后要怎么匹配数据呢?再考虑到OCR的准确率以及匹配的难度,可能不如手动录入

协作表格能加上单词词头一项吗?这样找起来改方便很多呀。

1 个赞

outdated

在线版已经更新词头,可以从这里下载 https://cloud.freemdict.com/index.php/s/zaSKmjwpfZznJrT


忠实原貌就要留空,也可以找其他词典补上,但要注明出处,以免混淆

先领一点看看进度如何。
M0403~M0420

建议楼主将领过的序号放在一楼。

好的,已更新一楼。

M402前面剩余的空位都已经被认领,后面的同学可以从M0403开始

好的,我先领到420吧。

认领了k

M0926 K a written abbreviation of kilobyte 书面缩写=kilobyte 千字节,千位元组
M0927 kart a small motor vehicle with an open frame and four wheels, used in races
M0928 KB written abbreviation of kilobyte 书面缩写=kilobyte 千字节,千位元组
M0929 keep to leave something in a particular place, so that you can find it 存放,保存
M0930 keep to not go near someone or something 勿靠近
M0931 kennel a place where dogs are looked after while their owners are not at home (主人外出时寄养狗的)养狗场;狗房
M0932 kept the past tense and past participle of keep keep的过去式和过去分词
M0933 keyboard a set of keys on a computer, a piano etc that you press to produce letters or sounds (电脑、钢琴等的)键盘
M0934 keyboard an electronic musical instrument similar to a piano that can make sounds like many different instruments 电子键盘乐器,电子琴
M0935 kick to start 【非正式】开始
M0936 kiddie a young child 【尤英,非正式】小孩
M0937 kill to spend time doing something that is not important while you are waiting for something else to happen 【非正式】消磨[打发]时间
M0938 knee the part of your trousers that covers your knee [裤子的]膝部
M0939 knew the past tense of know know的过去式
M0940 knot to fasten something by tying together pieces of string, rope etc 使打结
M0941 know used to agree with someone 我知道[用于表示同意对方的观点]
M0942 know to be wise and experienced enough to not do something 明白事理(而不做某事)
M0943 know used to make sure that someone understands what, who etc you are talking about 你知道吗,你懂吗[用来确定别人理解自己的话]
M0944 know used to emphasize a statement 你要知道[用于强调]
M0945 know used to pause while you think of what to say next 你知道的[用于思考接着说什么时的停顿]
M0946 known the past participle of know know的过去分词
M0947 Koran the holy book of the Muslims 《古兰经》,《可兰经》
1 个赞

在添加繁体没有释义的解释时,关于方括号和圆括号。

我没找到longman active study dictionary 的pdf版本,找到了朗文活用字典。

即,单词释义的范围进行更加限定缩小精确,则用〔〕,限定缩小精确的单词的哪些部分呢?

  1. 有自身的性质特点
  2. 有自身和其他事物搭配的对两者关系、搭配对象的要求、常用

可有可无的表述习惯,则用(),如拍照(功能)手机可以叫做拍照手机也可以叫拍照功能手机。

看得出这个繁体的标点符号的使用是不同于 中华人民共和国国家标准标点符号用法 的。简体的解释用圆括号。。

顺便,逗号如果也是中文简体更习惯的标点的话,有的地方也应该是顿号而不是逗号。大家阅读、查词的时候人脑自动加个判断识别转换吧,因为全新规则好学,但是规则的新不是在于全新的记忆点,而是跟已经学的汉语的标点的记忆混淆、冲突、多义,就需要额外的脑汁转换了。

顿号、逗号、分号的共同点是并列性,区别在于不同层级的并列,拒绝于对应的英文原文:

  1. 英文释义是一段话,这段话的某一个词对应中文不好直接对应翻译,而采取加详细信息构成多个元素举例让读者自己总结共性的,那就是用顿号。
  2. 英文释义是一段话,就是指代一种情况,那么中文对应多个词,用逗号。
  3. 英文释义是一段话,但是有两种情况,含有or的,那么汉语用分号。

以上标点可以嵌套,因为是不同层级的并列,就像文件夹一样。。

其实大部分翻译是很精确慎重的。。只不过有的真的让珠玉蒙尘了。

if an object catches your eye, you notice it because it is interesting or attractive 引起某人的注意

虽然在例句里补上了这个吸引(即有吸引力的注意而非更宽泛的注意。。)但是英文的原文有interesting和attractive没用褒义词。我好想给他改成“吸引某人的目光”。

1 个赞

我先领M1780-M1849,字母W开始到最后

3 个赞

E003是私用区的字符,要配合特定字体才知道代表什么含义。我搜了下这本词典里还有27个这种字符,等后续对照纸书修正一下


没找到就留空,纸质版好像阉割了不少内容,查不到很正常

1 个赞