制作双语对照的电子书,用 AI 翻译是否可行?

近日,数十位曾与哈珀柯林斯法国公司定期合作的译者陆续接到电话,被告知他们与该出版社的合作即将结束。出版社称正逐步放弃人工翻译,将委托外部服务提供商使用机器翻译软件处理文本,并直接聘请自由译者对机器生成的法语译文进行校对。

哈珀柯林斯出版社法国分公司称:正逐步放弃人工翻译,将测试人工智能辅助翻译 [链接]

国外有些小说自己看费劲,国内又出得比较慢,现在有没有开源的,可以生成双语对照电子书的开源项目?另外我还想把一些国内的儿童文学翻译成英文,制作成双语版,现在是否可行了?比如《米小圈上学记》之类的,这类书的特点是很适合双语学习,国内 L400–L600 学英语,国外 HSK3–4 学汉语,有很多教学机构有自制版,但差异都很大。

如果是自己用,感觉可以直接扔到 NotebookLM,翻译、解读、卡片、转音频、视频等全部搞定。

即使是图片、PDF都可以。

2 Likes

我试用过 NotebookLM,发现它在小说翻译上偏生硬,几乎捕捉不到角色的情绪变化。这也是我担心 AI 难以胜任长文本翻译的原因之一,因为真正的长篇阅读不仅需要良好的排版,还依赖对角色的理解、统一的翻译风格以及术语前后一致性。

还是需要人工润色吧。我感觉现在很多译文都什么做了,机器译一遍再人工润色,轻松还能掌控质量。

2 Likes

现在确实还需要人工润色,不知道有没有人总结过有什么流程可以让 AI 完成最后一步润色的工作,在有声书那边就有很多开源工具,可以通过 AI 合成模拟对话角色的情绪和声色,翻译这边还没有见过。

现在的ai还只是一个知识库,能做简单的翻译已经了不起了,期待它进化到夏济安的水平,我看难。想要短平快,就不要在意带泥的萝卜;想精雕细琢,只能慢慢来。

1 Like

你这句话就方向偏了。

用ai搞翻译,这会越来越多,越来越方便,越来越准确。
但是,什么是准确??? 对客观的文字,尤其自然科学的论文或书籍,可以依靠ai翻译或解读或浓缩。而对于文学,你提到小说,怎么能依靠AI“捕捉 角色的情绪变化呢? 一千个人有一千个哈姆雷特。AI翻译后的文字是死的,怎么读,怎么理解,文字怎么影响你的思绪和感情,全在于你。这无可替代,AI不能替代你,别的生物的人,也不能替代你。
呵呵,外语还得要学,只是有AI学得更快,用得更高效而已。

你读过英翻小说吗?一个 cousin 就足以让 AI 在表哥、表弟、表姐、表妹、堂兄弟姐妹之间来回乱跳,读者根本无法判断谁是谁。尤其在奇幻小说里,家族世系往往贯穿整个世界观,亲属关系一旦翻错,故事就完全读不下去,另外 AI 已经能捕捉角色画像和人物情绪了,只是这不是简单的一键翻译就能搞定的事。

这个观点是我一直赞成的。

一方面,对AGI保持严重怀疑。最近千问在大力推广,其CTO认为AI幻觉不是问题,只要给定足够的数据。但在我自己的使用过程中,千问时常一本正经的胡说八道,感觉其幻觉问题比豆包严重。

另一方面,对于专业领域的翻译者来说,不依靠AI则可能一堆佶屈聱牙的句子,要求专业人员同时又是驾驭语言的大师、还有时间精力干翻译的活不太现实。

AI 在编程领域发展得更快,可能在于编程本身包含许多可控、可验证的环节,这让模型更容易通过反馈不断优化。如果把翻译过程本身拆成若干可控的环节,先由 AI 完成术语一致性、角色画像和语义对齐等可验证的部分,最后再让 AI 参考前面的结果进行文学风格的润色,或许整体成文质量会更高。

1 Like

这个门槛太高,不如把人工介入的时机提前,把那些可验证、容易看出问题的部分先处理掉,真正的润色工作还是交给 AI 来完成。(这还需要一套完整的流程。

https://www.zhihu.com/question/13242386490
之前看知乎有人操作过,其实我也有几本书想用AI翻译,但是不太会操作,据我现在看书,然后使用deepseek的经验来说,deepseek比大部分人翻译的都要好,蒲隆算得上是著名翻译家了,他前两年翻译的《约翰生传》,我看有些地方还不如deepseek,比如这一句话
https://m.douban.com/book/discussion/637817107

1 Like

DeepSeek 的那个版本确实更好。看过很多评论都说现在写网文,小说大纲用 DeepSeek 的比较多,但缺点是文风不太行,理科生的文笔。

写小说不行,情节莫名其妙。但是翻译没问题。不过我是觉得有点不明白的时候就复制一句话,让它帮我分析,没有试过整本书翻译效果怎么样。但是我认为用deepseek先翻译整本书,然后人工进行逐字逐句的英汉校对,比单纯的一个人去翻译快100倍是没问题的。一本几十万单词的书,负责任的翻译家往往要翻译好几年甚至十多年,其中大部分时间都用在翻译一些熟词僻义、词组、俚语,琢磨一些怎么也不理解的地方,以及中文表达通畅上面,这些事情DeepSeek一天就做完了。

1 Like
3 Likes

AINIEE这个工具非常实用!我经常用它翻译文档。调用DeepSeek的API。

1 Like

两年前我就用过了,目前没看到更好更方便的工具。还可以考虑同贡献者的LinguaGacha。

1 Like

AiNiee 项目分析与借鉴

概述

对热门 AI 翻译工具 AiNiee 的深度分析,旨在挖掘其在 SRT 字幕翻译、长文本处理及工程化实现方面的亮点,为 srt_translate 插件的改进提供参考。

核心亮点分析

1. 智能非翻译内容保护 (Affix/Code Protection)

AiNiee 实现了强大的预处理机制,在翻译前自动识别并保护不需要翻译的内容。

  • 机制:识别 SRT 中的特殊符号、特效标签(如 {\an8})、数字序列、行首/行尾的特殊标记。将其替换为临时占位符(如 [CODE1]),仅发送纯文本给 AI,翻译完成后再还原。
  • 优势:防止 AI 幻觉修改关键的关键符号或格式,确保特效代码和时间轴元数据不受破坏。比单纯的正则后处理更稳健。

2. AI 术语提取与一致性 (AI Terminology Extraction)

提供独立的术语提取和管理流程,确保长视频翻译的一致性。

  • 机制:在正式翻译前,增加“预扫描”步骤,让 AI 提取人名、地名、专有名词,生成术语表(Glossary)。在后续翻译的 Prompt 中注入该术语表。
  • 优势:解决长视频(电影、剧集)中角色名翻译不统一的问题。

3. 滑动窗口上下文 (Sliding Window Context)

利用滑动窗口机制提供翻译上下文,而非简单的逐行或逐批翻译。

  • 机制:维护一个上下文缓存。在翻译当前批次时,将上一批次已翻译的文本作为 <previous_context> 发送给 AI(不要求重译,仅作参考)。
  • 优势:帮助 AI 保持人称入称代词(你/我/他)、语气和情节的连贯性,解决“割裂感”问题。

4. 结构化 Prompt 策略 (Prompt Engineering)

支持高度结构化和可配置的 Prompt 系统。

  • 机制
    • COT (Chain of Thought):引导 AI 先思考再翻译,提升复杂句子的理解准确度。
    • 风格定制:将“角色设定”、“背景设置”、“翻译风格”(直译/意译)作为独立配置项注入 System Prompt。
    • 特殊模型优化:针对 Sakura 等特定模型微调 Prompt。

5. 二次润色机制 (AI Polishing)

提供独立的“润色”阶段。

  • 机制:第一遍翻译注重准确和对齐,第二遍利用 AI 进行润色,提升通顺度和文学性。

对比与借鉴建议

srt_translate 插件的核心优势在于基于时间轴的重拆分算法 (Re-segmentation),解决了中英文句长差异大导致的视觉和节奏问题。AiNiee 则在工程化细节(符号保护、术语一致性)方面做得非常出色。

最佳结合策略
保持我们现有的重拆分算法优势,吸纳 AiNiee 的工程化保护机制和上下文管理策略,以提升翻译的鲁棒性和专业度。

2 Likes

借鉴 AiNiee 的经验,对自己的一个字幕翻译项目做了更进一步改进:

其中术语一致性,做了改进:自动提取人名/地名建立术语表,实现“边翻边学”的单次扫描一致性,不必多轮 AI 调用或手工维护。

2 Likes

最近谷歌开源了translategemma有4b,7b和12b的模型可依据自身电脑配置选择。可以下载个ollama部署translategemma大模型,然后用TranslateBooksWithLLMs,选择ollama里面的大模型,可以翻译epub,srt和txt格式的电子书,可选制作双语对照效果,不过我还没试过。