分享一种词典工作者独有的,提高AI机翻质量至基本接近人工翻译的方法

搜了下版内好像还没有讨论过这个。ai机翻的一大障碍就在于Polysemy(一词多义),所以提供更多的语境信息即可


先看结果,机翻效果对比

(以下几个词来自于OALD10中文翻译修正中网友提出的OALD10中机翻有问题的词)

关键词: somebody’s face fits/doesn’t fit
关键词释义: used to say that sb will/will not get a particular job or position because they have/do not have the appearance, personality, etc. that the employer wants, even when this should not be important
需要翻译的句子:

  1. If your face fits, you’ll get the job

OALD10:
如果你的脸型合适,你就会得到这份工作。
本贴:
如果你给人的感觉合适,这份工作就是你的了。


关键词: face
关键词释义: if you can’t face sth unpleasant, you feel unable or unwilling to deal with it
需要翻译的句子:

  1. He wasn’t able to face the washing up.

OALD10:
他无法面对洗碗
本贴:
他不愿意去洗碗


关键词:cipher
关键词释义: the first letters of sb’s name combined in a design and used to mark things
需要翻译的句子:

  1. The glasses were engraved with the Queen’s cipher.

OALD10:
眼镜上刻有女王的密码。
本贴:
眼镜上刻有女王名字首字母的标志。


关键词:faddy
关键词释义:liking some things and not others, especially food, in a way that other people think is unreasonable
需要翻译的句子:

  1. He’s always been faddy about his food.

OALD10:
他对食物一向很挑剔。
本贴
他对吃的东西总是挑三拣四。


原理:prompt engineering. 将翻译分为多步骤进行,使AI能够进行反思。提供更多的语境信息。
此prompt在@宝玉的分享的基础上进行调整优化,进一步提供词典条目的附加信息。

Instruction:

你是一个专业的英语翻译团队领导,负责安排和协调团队成员完成高质量的翻译工作,力求实现"信、达、雅"的翻译标准。翻译流程如下:

翻译准备:用户会提供需要翻译的句子;关键词;关键词释义。将这三个元素先提取出来。

翻译阶段 - 对每个需要翻译的句子都执行以下三轮翻译:
第一轮翻译 - 直译。分开思考和翻译内容:
【思考】将英文翻译成中文,确保关键词的翻译符合给定的关键词释义。如果关键词的翻译很长,将其精简成一到二个词语放进主句中。
【翻译】

第二轮翻译 - 意译。分开思考和翻译内容:
【思考】第二轮翻译需要从多角度思考原文的深层含义,深入理解原文的文化背景、语境和言外之意,把握文章的中心思想和情感基调。以偏口语化的方式进行意译,以生动自然的形式进行表达,进一步提升翻译质量。力求意境契合、行文简洁、通俗易懂。注意:不要在末尾加上自己的总结。
【翻译】

第三轮翻译 - 校对。分开思考和翻译内容:
【思考】第三轮翻译要对比原文和译文,确保译文没有常见的翻译失误(错漏、歧义、误解)。保持句子自然流畅,避免过于书面化的表达。注意:不要在末尾加上自己的总结
【翻译】

整合阶段:把所有句子的译文以字符串数组的形式返回

此prompt中,翻译要求是偏口语化、避免过于书面化。但其实除了关键词的用法、释义,有些条目还会有更多语境信息(informal, disapproving, formal, humorous等),此时可以程序化动态调整prompt。(或者直接进一步调整prompt,根据给定的context进行不同形式的表达)

另外值得一提的是此方法的算力成本较低,可以在本地跑。以上测试结果来自于阿里的开源模型qwen2.5:32b。

测试方式:

  1. 各类chatbot在线网站,chatgpt,通义千问,豆包等
  2. hf - qwen2.5在线(需注册)
9 Likes