通过 SiliconCloud 平台提供的大语言模型 API 服务,让在 GoldenDict-ng 中利用 AI 辅助学习变得更加便捷。此文提供一个开箱即用的方法,几分钟就能在 GD-ng 中配置好一个 AI 小助手。
1. AI 时代的翻译和词典
机器翻译
大模型的兴起导致传统机器翻译日渐式微,利用大模型完成翻译任务已成主流趋势。通过简单调整提示词就可以指挥 AI 进行翻译,并能轻易获得不同风格、语气和复杂度的译文。各大公司已经在它们原有的传统机器翻译服务基础上集成了基于大模型的翻译功能。原先可以免费使用的在线翻译服务,在贴上了“AI”标签后设置了使用门槛,而且这一门槛还不低。新的商业模式已然成型,包括订阅付费,按量付费,开始收购用户韭菜。
但是,与传统机器翻译相比,AI翻译的效果是否更好呢?从我的体验来看,AI 往往能够更准确地“理解”复杂句子的含义(虽然并不是每一次都能做到)。用 provisional 词源的例子来说明,原句来源于 词源在线
“as a temporary arrangement, provided for present need or occasion,” c. 1600, from provision (n.) + -al (1), or else from French provisionnal (15c.), from provision. The notion is of something that will “provide for present needs.” Related: Provisionally.
-
传统机器翻译(百度):
“作为一种临时安排,为目前的需要或情况而提供”,约1600年,来自第(n)±al(1)条,或来自法国第(15c)条,来自规定。这个概念是指将“满足当前需求”的东西。相关:暂时的。 -
AI 翻译(通义千问 Qwen2-72B-Instruct)::
“作为一种临时安排,为当前的需求或场合提供,”约1600年,来源于 provision(供应)+ -al (1)(形容词后缀),或者源自法语 provisionnal(15世纪),源于provision。其含义是某事物将“为当前需求提供”。相关词汇:provisionally(临时地)。
在这一例子中,传统的机器翻译似乎未能捕捉到句子的深层含义,没有意识到保留某些词汇的原貌对于传达其本来意义的重要性。相比之下,AI 翻译则表现得更为出色。(这仅是个案分析,并非断言 AI 总是优于传统方法)。
词典软件的 AI 功能
主流词典软件如有道词典、欧路词典等,早已在其软件中集成 AI 功能,诸如 AI 短文助记(用生词生成短文)、AI 对话、AI 解释、句子润色、语法纠正等。语言学习的方式正在发生深刻变革。但是变革是需要付出代价的(指物理代价:VIP 用户专享)。如何在词典社区流行的开源词典软件 GD-ng 中也享受此类便捷?
2. 使用大模型 API (SiliconCloud)
AI 翻译,需要大语言模型的支持。词典中使用的各种 AI 辅助功能,亦是如此。坏消息是词典软件的 AI 功能通常需要付费订阅,好消息是有免费的 AI 可以白嫖。尽管在本地部署开源大模型是一个不错的选择,但需要强大的算力支持才能获得较好体验。
AI 初创公司硅基流动,其一站式云服务平台 SiliconCloud 集合了多种领先的主流开源大模型,参见 pricing,最重要的是平台对这些模型做了推理加速,速度极快。以下是已部署的部分大模型示例:
提供商 | 模型 | 备注 |
---|---|---|
阿里云 | Qwen2-72B-Instruct | 阿里云新一代通义千问大模型 |
Meta | Llama-3.1-405B | 目前规模最大的开源大模型,根据官方提供的数据,多项评测指标超越了最强闭源大模型 GPT-4o 和 Claude 3.5 Sonnet,并在这些指标中全面超越了 GPT-4 |
深度求索 | DeepSeek-V2-Chat,DeepSeek-Coder-V2-Instruct | 自己在用,感觉可以 |
智普 AI | glm-4-9b-chat,chatglm3-6b | |
零一万物 | Yi-1.5-9B-Chat-16K | |
书生·浦语 | internlm2_5-20b-chat | |
gemma-2-27b-it |
上手体验下来,感觉 Qwen2-72B-Instruct 和 DeepSeek-V2-Chat 这两个收费模型比较能打,后者甚至比 DeepSeek 官方API 还要快不少。值得一提的是,包括 Qwen2-7B-Instruct 在内的12 个模型可以免费使用(免费模型不是太好用)。另外,新注册用户可立即获得 14 元额度(相当于 2 千万 Qwen1.5-14B tokens),没有时限,可以用好一阵子。
要使用 SiliconCloud API 服务,首先在其官网 SiliconFlow, Accelerate AGI to Benefit Humanity 注册账号。接着在 体验中心 创建新的密钥,在 GoldenDict-ng 中配置 AI 时需要用到。
成功注册并创建密钥后,可以在其体验中心测试不同模型的效果
3. 在 GoldenDict-ng 中配置 AI
GD-ng 配置方法
-
为了在 GD-ng 中使用 AI,可借助如下文件。
chatchat.zip (267.8 KB) -
解压后,使用记事本打开 main.js,找到 API_KEY,填写从 SiliconCloud 获取的密钥,格式为 sk-xx
-
在浏览器中打开 index.html,获取文件地址,格式为 file:///xx
- 接着打开 GD-ng, 在菜单栏上点击编辑=>词典,进入词典设置界面。在词典来源=>网站页面,添加刚才的地址,填入名称,勾选“已启用”,取消勾选“作为链接”(否则会嵌入 iframe)。点击 Apply 保存变更。
至此,已可开始在 GD-ng 中体验爱。
使用 AI 翻译
- 对 GD-ng 搜索框里的文字进行翻译
- 对页面中的文字进行翻译。选择句子中的任意文字后,在弹出菜单中点击“单句”,对文字所在句子进行翻译。点击“批量”,对所有相同类型(指 class 相同的 Dom 元素)的句子进行翻译。翻译结果会紧跟在原句之后。
与 AI 对话
- 点击左下角蓝色按钮调出聊天界面。输入消息开始聊天。
- 切换模型。注意只选择文本生成模型(其他的是向量&重排、图片生成、多模态大模型,在这里不使用)。关于模型的类型参见 https://siliconflow.cn/zh-cn/pricing。
4. 使用案例
- 口语学习每日打卡
- 同义词辨析
- AI 短文助记
5. Todo
-
近期会把 LobeChat 助手市场或者社区的一些助手加进来,方便与各种设定好的 AI 角色聊天。