搜了下版内好像还没有讨论过这个。ai机翻的一大障碍就在于Polysemy(一词多义),所以提供更多的语境信息即可
先看结果,机翻效果对比
(以下几个词来自于OALD10中文翻译修正中网友提出的OALD10中机翻有问题的词)
关键词: somebody’s face fits/doesn’t fit
关键词释义: used to say that sb will/will not get a particular job or position because they have/do not have the appearance, personality, etc. that the employer wants, even when this should not be important
需要翻译的句子:
- If your face fits, you’ll get the job
OALD10:
如果你的脸型合适,你就会得到这份工作。
本贴:
如果你给人的感觉合适,这份工作就是你的了。
关键词: face
关键词释义: if you can’t face sth unpleasant, you feel unable or unwilling to deal with it
需要翻译的句子:
- He wasn’t able to face the washing up.
OALD10:
他无法面对洗碗
本贴:
他不愿意去洗碗
关键词:cipher
关键词释义: the first letters of sb’s name combined in a design and used to mark things
需要翻译的句子:
- The glasses were engraved with the Queen’s cipher.
OALD10:
眼镜上刻有女王的密码。
本贴:
眼镜上刻有女王名字首字母的标志。
关键词:faddy
关键词释义:liking some things and not others, especially food, in a way that other people think is unreasonable
需要翻译的句子:
- He’s always been faddy about his food.
OALD10:
他对食物一向很挑剔。
本贴
他对吃的东西总是挑三拣四。
原理:prompt engineering. 将翻译分为多步骤进行,使AI能够进行反思。提供更多的语境信息。
此prompt在@宝玉的分享的基础上进行调整优化,进一步提供词典条目的附加信息。
Instruction:
你是一个专业的英语翻译团队领导,负责安排和协调团队成员完成高质量的翻译工作,力求实现"信、达、雅"的翻译标准。翻译流程如下:
翻译准备:用户会提供需要翻译的句子;关键词;关键词释义。将这三个元素先提取出来。
翻译阶段 - 对每个需要翻译的句子都执行以下三轮翻译:
第一轮翻译 - 直译。分开思考和翻译内容:
【思考】将英文翻译成中文,确保关键词的翻译符合给定的关键词释义。如果关键词的翻译很长,将其精简成一到二个词语放进主句中。
【翻译】
第二轮翻译 - 意译。分开思考和翻译内容:
【思考】第二轮翻译需要从多角度思考原文的深层含义,深入理解原文的文化背景、语境和言外之意,把握文章的中心思想和情感基调。以偏口语化的方式进行意译,以生动自然的形式进行表达,进一步提升翻译质量。力求意境契合、行文简洁、通俗易懂。注意:不要在末尾加上自己的总结。
【翻译】
第三轮翻译 - 校对。分开思考和翻译内容:
【思考】第三轮翻译要对比原文和译文,确保译文没有常见的翻译失误(错漏、歧义、误解)。保持句子自然流畅,避免过于书面化的表达。注意:不要在末尾加上自己的总结
【翻译】
整合阶段:把所有句子的译文以字符串数组的形式返回
此prompt中,翻译要求是偏口语化、避免过于书面化。但其实除了关键词的用法、释义,有些条目还会有更多语境信息(informal, disapproving, formal, humorous等),此时可以程序化动态调整prompt。(或者直接进一步调整prompt,根据给定的context进行不同形式的表达)
另外值得一提的是此方法的算力成本较低,可以在本地跑。以上测试结果来自于阿里的开源模型qwen2.5:32b。
测试方式:
- 各类chatbot在线网站,chatgpt,通义千问,豆包等
- hf - qwen2.5在线(需注册)