OED人机协作翻译(双解)项目

aamgreen · 2025 年6 月 17 日 06:23

如果是就我个人的想法来说我是倾向于不处理OE ME的因为这些只能增加无谓的工作量而且又没有人看我更倾向于从这些词义去寻找的用法逻辑让人迅速提升水平

增上慢 · 2025 年6 月 17 日 06:26

现代英语都是从OE(ME)和其他语言不断交错演变的结果，你又想了解一个词的所有用法（母语者根据环境以及社会发展，改变某个词的用法或者引进某个词，是不需要给ESL们打招呼的，ESL们是无法了解所有时期的所有地区的所有情况的，连母语专家也不一定能全掌握，很多forms都是从现存的古籍里记录或者是语言学家们处理的结果），那不看OE和ME，你还不如就看ODE或者ECD或者习语类词典。

aamgreen · 2025 年6 月 17 日 06:28

话虽这么说如果是面面俱到的话根本没法学没法做了

增上慢 · 2025 年6 月 17 日 06:31

不贪多就好。

aamgreen · 2025 年6 月 17 日 06:33

只能尽量在自己的能力范围内吧

增上慢 · 2025 年6 月 17 日 07:30

兄，“词典杂货铺”不是一本词典吧？为什么是dictionarium，考虑过复数形式吗？

137229 · 2025 年6 月 17 日 08:16

Z 词条 1321个已经洗版点击可用
Z 词条 1321.7z (9.2 MB)

![QQ_1750148162005|690x442](upload://4ZpmZ5M3tVdkBh0dJn2pFM9L3lw.png
例句 7249 注意不能翻译标签里面的东西
例句 7249_.7z (290.8 KB)

mixivivo · 2025 年6 月 17 日 08:36

复数形式会比较正确，但词形看上去丑，我喜欢ium结尾的形式，用它结尾的新造词在科学、文学、it界也是传统了，最新的就有trainium、codeium等。

Deepl · 2025 年6 月 17 日 08:51

我真不懂你们在这里争个什么劲，有这时间吵架不如直接开始动手做，两三天就能整出个初步汉化的版本来。是骡子是马拉出来溜溜就知道了。

我没有要打广告的意思，但现在已经有工具能可以实现全自动的AI翻译了。沉浸式翻译能自动解析HTML文本格式，生成双语对照翻译，嫌AI不靠谱，使用时先看一眼译文上面的英语原文就行了（至于排版效果，打开OED官网用沉浸式翻译插件试试就知道了）。AI术语表、自定义提示词等功能都齐全。沉浸式翻译一个月会员79元，直接提供了deepseek，chatGPT，gemini等AI服务，不用自已准备API，一个月有高达两千万token的额度（不够还能买），翻译OED几乎是够用了。

整个翻译过程需要人工的地方也就是配置提示词、洗版和调整文件格式之类的非重复性劳动。至于人工校对译文——我只能说我很敬佩能提出这种想法的人。这种给巨型词典作修订的事在我的印象中都是和“国家科研基金支持”、“高校专家团队合作”之类的字眼挂钩的。

需要的话，我可以提供从《语言学与应用语言学百科全书》mdx中提取出来的英汉对照表，有一万条语言学术语的英汉对照。（因为是自用的，我没有校对过，要用的话恐怕得先检查一遍）

aamgreen · 2025 年6 月 17 日 09:20

我本来是东一嘴西一嘴自己在慢慢搞结果和@fuzzygz聊天他对OED也很有兴趣于是我就想着能不能发挥大家的力量把OED给搞出来从大家提到的情况来看其一工作量巨大其次就是大家担心AI的质量其实就我个人来说我倾向于选出部分词比如说根据COCA的词频从1-50000的词即便这样从其他朋友的实践来说恐怕也是相当困难再有就是后续的校核纯粹的术语反倒不是问题最怕的是那些术语却又没有统一翻译的地方再有就是既然是翻译也不想像王同忆老师那样不做加工的直译要不然也就失去了付出劳动的价值和意义了现在讨论下来似乎难度相当大实在不行我就继续按以前的路子自己搞能搞多少算多少这样虽说慢也算是搞一个算一个

aamgreen · 2025 年6 月 17 日 09:27

国家出钱搞的要么是国家认为有用的要么是糊弄人的咱们自己做的当然是尽量朝解决问题有用的方向去做现在国家每年都有很多项目很多资金但是我们还没有看到有哪一个是从普通的学习者角度出发去解决学习过程中遇到的与词义用法有关的问题看现在的书辞典用法词义等等哪一个不是代代相传习习相因基本上看不出创新在哪里现在很多人弄语料库其实创新的东西也不是很多而在这个透明的领域里要想弄出个东西来没有任何支持又是何其困难！唉

Deepl · 2025 年6 月 17 日 09:29

说实话，现在的AI还暂时没有发展到能让人以个人之力完成以前需要一个专家团队才能完成的事情。我衷心建议你能沉下心，等待AI科技发展到更完善的时候再考虑搞那种完善的宏大项目。我很敬佩你的雄心，但现在只要（也只能）搞出一个能用的版本就足够了。

aamgreen · 2025 年6 月 17 日 09:30

这个好多了基本上能看出词条词义和例句了能不能教一下怎么把不必要的东西洗掉？这样我好试着看看其他的材料

aamgreen · 2025 年6 月 17 日 09:32

现在来看估计也只好如此我前面已经做了一些摸索不过很不成熟现在需要结合OED来重新做只能慢慢来了

mixivivo · 2025 年6 月 17 日 10:30

这个压缩包我的电脑报病毒，是什么问题？

aamgreen · 2025 年6 月 17 日 10:39

我这里正常的没有报

mixivivo · 2025 年6 月 17 日 10:47

Published Apr 28, 2021 | Updated Not applicable

Trojan:Script/Sabsik.TE.A!ml

last_idol · 2025 年6 月 17 日 11:35

0/61 No security vendors flagged this file as malicious

Hannibal · 2025 年6 月 17 日 12:53

都用OED了，要翻译的意义是什么？如果是人工翻译精细打磨的可以参考学习，但用AI翻译？看不出实际的意义。
学翻译有专门的书，OED看不懂还有别的书可以读。可用AI翻译耗费的是时间精力金钱，如此耗神费力之事，建议三思。

mixivivo · 2025 年6 月 17 日 14:53

谢谢测试，那可能是误报。