制作双语对照的电子书，用 AI 翻译是否可行？

last_idol · 2026 年1 月 11 日 03:53

近日，数十位曾与哈珀柯林斯法国公司定期合作的译者陆续接到电话，被告知他们与该出版社的合作即将结束。出版社称正逐步放弃人工翻译，将委托外部服务提供商使用机器翻译软件处理文本，并直接聘请自由译者对机器生成的法语译文进行校对。

哈珀柯林斯出版社法国分公司称：正逐步放弃人工翻译，将测试人工智能辅助翻译 [链接]

国外有些小说自己看费劲，国内又出得比较慢，现在有没有开源的，可以生成双语对照电子书的开源项目？另外我还想把一些国内的儿童文学翻译成英文，制作成双语版，现在是否可行了？比如《米小圈上学记》之类的，这类书的特点是很适合双语学习，国内 L400–L600 学英语，国外 HSK3–4 学汉语，有很多教学机构有自制版，但差异都很大。

Vim · 2026 年1 月 11 日 04:12

如果是自己用，感觉可以直接扔到 NotebookLM，翻译、解读、卡片、转音频、视频等全部搞定。

即使是图片、PDF都可以。

last_idol · 2026 年1 月 11 日 04:23

我试用过 NotebookLM，发现它在小说翻译上偏生硬，几乎捕捉不到角色的情绪变化。这也是我担心 AI 难以胜任长文本翻译的原因之一，因为真正的长篇阅读不仅需要良好的排版，还依赖对角色的理解、统一的翻译风格以及术语前后一致性。

winn · 2026 年1 月 11 日 04:39

还是需要人工润色吧。我感觉现在很多译文都什么做了，机器译一遍再人工润色，轻松还能掌控质量。

last_idol · 2026 年1 月 11 日 06:05

现在确实还需要人工润色，不知道有没有人总结过有什么流程可以让 AI 完成最后一步润色的工作，在有声书那边就有很多开源工具，可以通过 AI 合成模拟对话角色的情绪和声色，翻译这边还没有见过。

winn · 2026 年1 月 11 日 07:42

现在的ai还只是一个知识库，能做简单的翻译已经了不起了，期待它进化到夏济安的水平，我看难。想要短平快，就不要在意带泥的萝卜；想精雕细琢，只能慢慢来。

leoleo · 2026 年1 月 11 日 14:30

你这句话就方向偏了。

用ai搞翻译，这会越来越多，越来越方便，越来越准确。
但是，什么是准确？？？对客观的文字，尤其自然科学的论文或书籍，可以依靠ai翻译或解读或浓缩。而对于文学，你提到小说，怎么能依靠AI“捕捉角色的情绪变化呢？一千个人有一千个哈姆雷特。AI翻译后的文字是死的，怎么读，怎么理解，文字怎么影响你的思绪和感情，全在于你。这无可替代，AI不能替代你，别的生物的人，也不能替代你。
呵呵，外语还得要学，只是有AI学得更快，用得更高效而已。

last_idol · 2026 年1 月 11 日 15:58

你读过英翻小说吗？一个 cousin 就足以让 AI 在表哥、表弟、表姐、表妹、堂兄弟姐妹之间来回乱跳，读者根本无法判断谁是谁。尤其在奇幻小说里，家族世系往往贯穿整个世界观，亲属关系一旦翻错，故事就完全读不下去，另外 AI 已经能捕捉角色画像和人物情绪了，只是这不是简单的一键翻译就能搞定的事。

endnote · 2026 年1 月 12 日 07:55

这个观点是我一直赞成的。

一方面，对AGI保持严重怀疑。最近千问在大力推广，其CTO认为AI幻觉不是问题，只要给定足够的数据。但在我自己的使用过程中，千问时常一本正经的胡说八道，感觉其幻觉问题比豆包严重。

另一方面，对于专业领域的翻译者来说，不依靠AI则可能一堆佶屈聱牙的句子，要求专业人员同时又是驾驭语言的大师、还有时间精力干翻译的活不太现实。

last_idol · 2026 年1 月 12 日 11:38

AI 在编程领域发展得更快，可能在于编程本身包含许多可控、可验证的环节，这让模型更容易通过反馈不断优化。如果把翻译过程本身拆成若干可控的环节，先由 AI 完成术语一致性、角色画像和语义对齐等可验证的部分，最后再让 AI 参考前面的结果进行文学风格的润色，或许整体成文质量会更高。

last_idol · 2026 年1 月 12 日 11:59

这个门槛太高，不如把人工介入的时机提前，把那些可验证、容易看出问题的部分先处理掉，真正的润色工作还是交给 AI 来完成。（这还需要一套完整的流程。

qujinzhi · 2026 年1 月 12 日 12:15

https://www.zhihu.com/question/13242386490
之前看知乎有人操作过，其实我也有几本书想用AI翻译，但是不太会操作，据我现在看书，然后使用deepseek的经验来说，deepseek比大部分人翻译的都要好，蒲隆算得上是著名翻译家了，他前两年翻译的《约翰生传》，我看有些地方还不如deepseek，比如这一句话
https://m.douban.com/book/discussion/637817107

last_idol · 2026 年1 月 12 日 12:48

DeepSeek 的那个版本确实更好。看过很多评论都说现在写网文，小说大纲用 DeepSeek 的比较多，但缺点是文风不太行，理科生的文笔。

qujinzhi · 2026 年1 月 12 日 12:53

写小说不行，情节莫名其妙。但是翻译没问题。不过我是觉得有点不明白的时候就复制一句话，让它帮我分析，没有试过整本书翻译效果怎么样。但是我认为用deepseek先翻译整本书，然后人工进行逐字逐句的英汉校对，比单纯的一个人去翻译快100倍是没问题的。一本几十万单词的书，负责任的翻译家往往要翻译好几年甚至十多年，其中大部分时间都用在翻译一些熟词僻义、词组、俚语，琢磨一些怎么也不理解的地方，以及中文表达通畅上面，这些事情DeepSeek一天就做完了。

last_idol · 2026 年1 月 12 日 12:56

masmo · 2026 年1 月 13 日 16:21

AINIEE这个工具非常实用！我经常用它翻译文档。调用DeepSeek的API。

amob · 2026 年1 月 13 日 17:08

两年前我就用过了，目前没看到更好更方便的工具。还可以考虑同贡献者的LinguaGacha。

Vim · 2026 年1 月 16 日 09:52

AiNiee 项目分析与借鉴

概述

对热门 AI 翻译工具 AiNiee 的深度分析，旨在挖掘其在 SRT 字幕翻译、长文本处理及工程化实现方面的亮点，为 srt_translate 插件的改进提供参考。

核心亮点分析

1. 智能非翻译内容保护 (Affix/Code Protection)

AiNiee 实现了强大的预处理机制，在翻译前自动识别并保护不需要翻译的内容。

机制：识别 SRT 中的特殊符号、特效标签（如 {\an8}）、数字序列、行首/行尾的特殊标记。将其替换为临时占位符（如 [CODE1]），仅发送纯文本给 AI，翻译完成后再还原。
优势：防止 AI 幻觉修改关键的关键符号或格式，确保特效代码和时间轴元数据不受破坏。比单纯的正则后处理更稳健。

2. AI 术语提取与一致性 (AI Terminology Extraction)

提供独立的术语提取和管理流程，确保长视频翻译的一致性。

机制：在正式翻译前，增加“预扫描”步骤，让 AI 提取人名、地名、专有名词，生成术语表（Glossary）。在后续翻译的 Prompt 中注入该术语表。
优势：解决长视频（电影、剧集）中角色名翻译不统一的问题。

3. 滑动窗口上下文 (Sliding Window Context)

利用滑动窗口机制提供翻译上下文，而非简单的逐行或逐批翻译。

机制：维护一个上下文缓存。在翻译当前批次时，将上一批次已翻译的文本作为 <previous_context> 发送给 AI（不要求重译，仅作参考）。
优势：帮助 AI 保持人称入称代词（你/我/他）、语气和情节的连贯性，解决“割裂感”问题。

4. 结构化 Prompt 策略 (Prompt Engineering)

支持高度结构化和可配置的 Prompt 系统。

机制：
- COT (Chain of Thought)：引导 AI 先思考再翻译，提升复杂句子的理解准确度。
- 风格定制：将“角色设定”、“背景设置”、“翻译风格”（直译/意译）作为独立配置项注入 System Prompt。
- 特殊模型优化：针对 Sakura 等特定模型微调 Prompt。

5. 二次润色机制 (AI Polishing)

提供独立的“润色”阶段。

机制：第一遍翻译注重准确和对齐，第二遍利用 AI 进行润色，提升通顺度和文学性。

对比与借鉴建议

srt_translate 插件的核心优势在于基于时间轴的重拆分算法 (Re-segmentation)，解决了中英文句长差异大导致的视觉和节奏问题。AiNiee 则在工程化细节（符号保护、术语一致性）方面做得非常出色。

最佳结合策略：
保持我们现有的重拆分算法优势，吸纳 AiNiee 的工程化保护机制和上下文管理策略，以提升翻译的鲁棒性和专业度。

Vim · 2026 年1 月 16 日 09:56

借鉴 AiNiee 的经验，对自己的一个字幕翻译项目做了更进一步改进：

其中术语一致性，做了改进：自动提取人名/地名建立术语表，实现“边翻边学”的单次扫描一致性，不必多轮 AI 调用或手工维护。

wangweicheng7 · 2026 年1 月 18 日 12:46

最近谷歌开源了translategemma有4b，7b和12b的模型可依据自身电脑配置选择。可以下载个ollama部署translategemma大模型，然后用TranslateBooksWithLLMs，选择ollama里面的大模型，可以翻译epub，srt和txt格式的电子书，可选制作双语对照效果，不过我还没试过。