个人用户自娱自乐还行,头部的 AI 公司估计都扫描过读秀书库或者做了类似的工作。OpenAI 和 Claude 都有出庭记录这是实锤的,谷歌是自建的书库。
真想看原版书的,直接用豆包就行了。
个人用户自娱自乐还行,头部的 AI 公司估计都扫描过读秀书库或者做了类似的工作。OpenAI 和 Claude 都有出庭记录这是实锤的,谷歌是自建的书库。
真想看原版书的,直接用豆包就行了。
目前翻译、OCR这些做自了汉,自娱自乐比较合适。真正有实力和进取心的,可以直接读英文(或者别的什么外文),例如现在要跟紧ai潮流,必须读英语论文原作;就阅读而言,大多数书图像pdf看一遍就行了,不值得OCR,少数经典或者需要深入反复研究的,自己OCR、校对文字也不是很复杂。
我测试gemini cli直接调用如果不改提示词会有近一半输出有问题,所以提示词要加入直接输出内容。不要写代码和调用write_file工具。
如何用好API、保证翻译质量,这个我认为探讨得不够,都是凭个人感觉
LLM翻译质量,在主流若干种语言之间,比如英译中、中译英,我认为2025年它基本已经被解决了。一个本地可以运行的模型,像qwen-30b-a3b,就能很好地处理翻译任务,遑论各大厂商的旗舰模型。现在人们挑剔的翻译质量,实际常常是不同模型、不同提示词下使用的翻译策略/风格,是否适配受众的口味的问题,而不是模型的性能问题。这种不适配在人工译员那里照样存在,是翻译得更符合原文,还是在目标语言里更自然流畅,二者经常并不可兼得。
如果对翻译结果不满意,换模型,改写prompt,直到符合自己的要求为止,如果还不满,通常的人工翻译也不会令你满意的,人类专家级的翻译又不肯付每小时200-500元的钱,那就没有解决方案了,建议跳过翻译,直接读原文。
去年有新模型发布,我一般会找若干样本测试它们的翻译性能,到了今年,我偶尔也会测试,但已经看不出不同模型的翻译能力有什么明显不同了,都干得不错,半斤八两。我也懒得去找或者设计越来越刁钻困难的翻译样例了,因为它们不是常规情况,普通的人类译者照样解决不好,那就没必要去为难ai。实在有这个需要,可以调用多个模型翻译,然后用一个最强的模型评判综合,它可能最终是一个想用多少算力的问题。
如果真的好用,希望站老大能发布一个在线版。
deepseek OCR,在 OCR Arena 的性能盲测里一直排名垫底,搞不明白为啥经常有人鼓吹它,这些人从不真的使用吗?
deepseek ocr出了v2
测试之前的样例:
师,故伐我也。若我出师,必惧而归。百濮离居,离居犹散处。将各走其邑,谁暇谋人?”意谓楚若伐庸,百濮将自退。乃出师。旬有五日,百濮乃罢。百濮见楚出师,果如芳贾之言,各自罢归。
自庐以往,振廪同食。庐见十四年传并注。楚由郢出师伐廪,必经庐,由郢至庐,尚自携粮。自庐出发以后,则开当地之仓廪散与将士食之。振读如周书克殷篇“振廪台之财”之“振”,犹散也。杜注:“振,发也。”亦通。杜注曰:“同食,上下无异馔也。”次于句滋。杜注以句滋为楚之西界,汇纂谓在今湖北省均县废冶西。使庐载梨侵庸,及庸方城。言庸之方城者,别于楚之方城也。高士奇地名考略云:“今竹山县东四十五里有方城,山上平坦,四面险固,山南有城周十余里,即春秋时‘庸方城’也。”庸人逐之,囚子扬窗。杜注:“窗,戢梨官属也。”子扬为其字,窗为其名,此亦犹文九年、宣四年之称斗椒为“子越椒”。三宿而逸,曰:“庸师众,群蛮聚焉,不如复大师,复大师谓复起楚之大师。杜注谓“还复句澨师”,不确。夫句澨之师既为伐庸而来,岂有不用之理?且下文有澨佞之言,则子扬此语,不仅为庐戢梨言之,且为楚之众将帅言之。且起王卒,欲尽用楚众。合而后进。”师叔曰:由宣十二年传文,知师叔即楚大夫澨佞。“不可。姑又与之遇以骄之。彼骄我怒,而后可克,先君蚡冒所以服区隰也。”楚世家云:“冒敖六年卒,子熊踦立,是为蚡冒。蚡冒十七年卒。蚡冒弟熊通弑蚡冒子而代立,是为楚武王。”然则蚡冒乃楚武王之兄,杜注云“楚武王父”,不知何据。梁玉绳史记志疑云:“韩子和氏篇谓‘厉王薨,武王即位’,外储说左上亦称‘楚厉王’,楚辞东方朔七谏云‘遇厉、武之不察,羌两足以毕斩’,是蚡冒谥厉王矣。”孔疏云:“言服区隰,则区隰本是他国,蚡冒始服之也。”顾栋高大事表云:“荆州府以东多山谿之险,因名。”又与之遇,七遇皆北,杜注:“军走日北。”北即背,转身而逃。此佯败北以骄敌也。唯裨、儋、鱼人实逐之。“儋”,或作“儋”,同音侍,亦音由。杜注:“裨、儋、鱼,庸三邑。”马宗琏补注云:“水经江水‘又东径鱼复
样本四:错 14 个字,比一代还差,用力过猛了,主贴已更新。
需要有正确的文本,才好对比不同引擎的识别结果。
我觉得可以每个词典校对几页,然后收集论坛现在的文本化工作成果,做一个类似OmniDocBench的标注数据集DictDocBench,对评测ai帮助更大。
补充一个Gemini 3 Flash的,现在OCR Arena排名最高,但样本少。
师,故伐我也。若我出师,必惧而归。百濮离居,离居犹散处。将各走其邑,谁暇谋人?”意谓楚若伐庸,百濮将自退。乃出师。旬有五日,百濮乃罢。百濮见楚出师,果如蒍贾之言,各自罢归。
自庐以往,振廩同食。 庐见十四年传并注。 楚由郢出师伐庸,必经庐,由郢至庐,尚自携粮。自庐出发以后,则开当地之仓廩散与将士食之。 振读如周书克殷篇“振鹿台之财”之“振”,犹散也。杜注:“振,发也。”亦通。 杜注曰:“同食,上下无异馔也。”次于句澨。 杜注以句澨为楚之西界,汇纂谓在今湖北省均县废治西。**使庐戢梨侵庸,及庸方城。**言庸之方城者,别于楚之方城也。高士奇地名考略云:“今竹山县东四十五里有方城,山上平坦,四面险固,山南有城周十余里,即春秋时‘庸方城’也。”庸人逐之,囚子扬窗。 杜注:“窗,戢梨官属也。”子扬为其字,窗为其名,此亦犹文九年、宣四年之称斗椒为“子越椒”。**三宿而逸,曰:“庸师众,群蛮聚焉,不如复大师,复大师谓复起楚之大师。杜注谓“还复句澨师”,不确。夫句澨之师既为伐庸而来,岂有不用之理?且下文有潘尪之言,则子扬此语,不仅为庐戢梨言之,且为楚之众将帅言之。且起王卒,欲尽用楚众。合而后进。”师叔曰:由宣十二年传文,知师叔即楚大夫潘尪。“不可。姑又与之遇以骄之。彼骄我怒,而后可克,先君蚡冒所以服陉隰也。” 楚世家云:“霄敖六年卒,子熊蚡立,是为蚡冒。蚡冒十七年卒。蚡冒弟熊通弒蚡冒子而代立,是为楚武王。”然则蚡冒乃楚武王之兄,杜注云“楚武王父”,不知何据。梁玉绳史记志疑云:“韩子和氏篇谓‘厉王薨,武王即位’,外储说左上亦称‘楚厉王’,楚辞东方朔七谏云‘遇厉、武之不察,羌两足以毕断’,是蚡冒谥厉王矣。”孔疏云:“言服陉隰,则陉隰本是他国,蚡冒始服之也。”顾栋高大事表云:“荆州府以东多山谿之险,因名。”又与之遇,七遇皆北, 杜注:“军走曰北。”北即背,转身而逃。此佯败北以骄敌也。唯裨、鯈、鱼人实逐之。 “鯈”,或作“鯈”,同音侍,亦音由。 杜注:“裨、鯈、鱼,庸三邑。”马宗琏补注云:“水经江水‘又东径鱼复
Gemini 3 Flash:错 8 个字。(DeepSeekOCR 一代的水平
蒍 → 𫇭,廩 → 廪,尪 → 尩,蚡 → 眴,弒 → 弑,断 → 斮,鯈 → 儵,侍 → 俦
OCR Arena 我测了十几次,感觉样本质量不太行,很多题目只是全角半角符号或边缘文本的小问题,根本拉不开模型之间的差距。这样测下来更像是在比较模型对人类偏好的迎合程度,而不是在真正测试文本识别能力。
dots.ocr的,好像也不太好
师,故伐我也。若我出师,必惧而归。百濮离居,离居犹散处。 将各走其邑,谁暇谋人?”意谓楚若伐庸,百濮将自退。乃出师。 旬有五日,百濮乃罢。百濮见楚出师,果如劳贾之言,各自罢归。
自庐以往,振廪同食。庐见十四年传并注。楚由郢出师伐庸,必经庐,由郢至庐,尚自携粮。自庐出发以后,则开当地之仓廪散与将士食之。振读如周书克殷篇“振鹿台之财”之“振”,犹散也。杜注:“振,发也。”亦通。杜注曰:“同食,上下无异馔也。”次于句澮。杜注以句澮为楚之西界,汇纂谓在今湖北省均县废治西。使庐戢梨侵庸,及庸方城。言庸之方城者,别于楚之方城也。高士奇地名考略云:“今竹山县东四十五里有方城,山上平坦,四面险固,山南有城周十余里,即春秋时‘庸方城’也。”庸人逐之,囚子扬窗。杜注:“窗,戢梨官属也。”子扬为其字,窗为其名,此亦犹文九年、宣四年之称斗椒为“子越椒”。三宿而逸,曰:“庸师众,群蛮聚焉,不如复大师,复大师谓复起楚之大师。杜注谓‘还复句澮师’,不确。夫句澮之师既为伐庸而来,岂有不用之理?且下文有潘 潘之言,则子扬此语,不仅为庐戢梨言之,且为楚之众将帅言之。且起王卒,欲尽用楚众。合而后进。”师叔曰:由宣十二年传文,知师叔即楚大夫潘 潘。“不可。姑又与之遇以骄之。彼骄我怒,而后可克,先君蚡冒所以服陉隰也。”楚世家云:“霄敖六年卒,子熊afs 竖,是为蚡冒。蚡冒十七年卒。蚡冒弟熊通弑蚡冒子而代立,是为楚武王。”然则蚡冒乃楚武王之兄,杜注云“楚武王父”,不知何据。梁玉绳史记志疑云:“韩子和氏篇谓“厉王薨,武王即位”,外储说左上亦称‘楚厉王’,楚辞东方朔七谏云‘遇厉、武之不察,羌两足以毕断’,是蚡冒谥厉王矣。”孔疏云:“言服陉隰,则陉隰本是他国,蚡冒始服之也。”顾栋高大事表云:“荆州府以东多山谿之险,因名。”又与之遇,七遇皆北,杜注:“军走曰北。”北即背,转身而逃。此佯败北以骄敌也。唯裨、僮、鱼人实逐之。“僮”,或作“ JAN”,同音俦,亦音由。杜注:“裨、僮、鱼,庸三邑。”马宗琏补注云:“水经江水‘又东径鱼复’
dots.ocr:错 8 个字。
劳 → 𫇭,澮 → 澨,潘 → 尩,afs → 眴,竖 → 立,断 → 斮,僮 → 鯈,JAN → 儵