任何大数据模型都不应仅当作单一工具来对待。例如 deepseek 不仅仅只有翻译一种功能。如果把他当作一个综合的学习辅助工具,实际上翻译只是使用它辅助学习的一个环节。我这有个例子:
一开始我让deepseek翻译一段文字(在之前的对话中我已经上传过完整的论文附件了):
整体来说不错,尤其是“这不仅包括……还将涵盖……”这一结构将原文结构转换的恰到好处。
但是,高亮部分很明显是中文看不懂,英文也看不懂。这三个单词很简单,意思也都懂,但是凑一块儿就懵了。
于是我追问:
它给的解释很详细,很明显,这三个词可以翻译为:
追踪记录、量化分析和经济补偿(是不是高大上了哈哈)
如果把大数据模型看作一个辅助人员,例如助理或顾问,那么使用它的过程就是和相关人员沟通的过程。在这个沟通过程中,一定存在一种信息差,或者语言符号的识别差异。某一语言符号在不同个体的语言体系中并不等同。这或许与个体间“读书的种类不同,多少也不同”导致的。这一差异由沟通而放大显现,也可以在沟通中解决。
这让我想起了我在前司的一个插曲。我的入职的第一份任务是做一张海报。我询问我的老板,这张海报是要放到什么媒介或物料上展示。我的本意是想通过这种方式分推出这张海报的尺寸。但老板直接告诉我就是用来发朋友圈的。所以,尺寸是多少?发朋友圈等于用手机。以手机为媒介,海报的最佳尺寸就是屏幕大小,而通用的屏幕尺寸是1080*1920px。。。
这就是语言符号的识别差异。我所说的是学术/专业语言,而老板回答的是通俗用语。两者表达的东西是相同的,但是要理解还需要一个传译的过程。
同样,回到刚刚的例子,deepseek以为我只想知道单词的意思,但是在追问下,它开始结合语言环境,开始站在专业角度给出回答。而沟通的结果是令人满意的。