Deepseek 的文本OCR能力竟然还挺好

Deepseek 最近太火了,目前看来不像吹牛逼,不然英伟达不会跌成这鸟样
目前虽然没上线多模态,但是可以长传图片识别文本
简单试了一个基本的中英文以及一些符号混排的文本,识别率几乎100%


5 Likes

试了试OCR的效果,确实蛮好用的,更重要的是免费且不用挂梯子。

1 Like

牛叉呀!!主要看生僻字。

想学习下载一个部署在本地,发现下载页面说了一下这个deepseek是“based on Llama and Qwen”,也算站在巨人的肩膀上了~

为何我上传了两张古籍图片,让其试着ocr,本来是竖排书,结果是按照从左到右的顺序,根本读不了。我觉得它ocr的能力还是比较差吧。现代横排版没有试。

1 Like

让子弹再飞一会儿吧。目前所谓的AI的关键在训练数据,数据不行再牛的模型也是人工智障。

对deepseek很失望,不仅仅是ocr,也包括提出一些问题观其回答,这个AI似乎对于古典的东西很陌生,或不知所云,或胡说八道,反正对我来说用处不大。


古籍图片是随意找的。清晰度一般,有夹注。这样清晰度的图片,deepseek ocr的结果实在太差了。

视频转文字助手(个人已购买注册,感觉此软件的功能很不错,推荐!)ocr结果,相当棒!


嶧陽桐杵鳴蓮岳石砧平待誰相應節要自不勝情
朱本
吹衣風稍急弔影月微明㑹
有不眠客聽此斷
作今
腸聲
擬阮步兵夜中不能寐丙寅十月京師賦
朱本
曹選
張燈開故書清霜屏雲物有
夜久不成寐
作片
作夢
月來庭除良時悵難再不與佳人俱掩卷長太息望
子城之隅
擬鮑溶寒宵歎丙寅十一月京師賦
孤缸照愁眠明滅知夜久熒熒月落林摵摵風入牖
#宜秋館

美人悵何許寤言不相偶心寄南征鴻雲漢長回首
遊雍丘燕溪分韻作丁卯二月領大匠屬治
事至雍丘與故人吳擇仁智夫趙子漪澄之同
遊因分韻賦詩余得漪字
原作緣據
解襟俯清池微風度修竹瑟
捨轡步平陸
朱本攺
瑟生淪漪梨華照晴影暖雪正紛披把酒久沈想況
與玉人期
擬王少伯新興丁卯四月京師賦
西北雲悠悠東南日杲杲浪語問陰晴懸知行雨少
原作模據
朱本
桃溪
青蔭夙昔一何好臨牖思茫

作蹊
朱本攺

可以说,仅仅是夹注的处理有些问题。

deepseek ocr结果,非常失望,根本无法读!

孤红照愁照明诚知夜久紫紫月落林城重城風入歸

魏絢潜寒宵款

两寅十一月京師賦

子城之隅

月來庭除長時候難再不與佳人俱掩盈長太息望

夜久不成寐休夢暖燈開故書清霜屏雲物有作曹片選

親兄步兵夜中不能寐

陽馨

吹衣風稍急吊影月微明會作今有不眠客聽此斷

曙陽桐杵鳴蓮岳石荷平待誰相應節要自不勝情

孙滨作舆:梁朱承政

西北臺悠悠東南日果宸諸問陰曆懸知行兩少

擬王少伯新興

丁卯四月京師賦

契玉人期

張生淪滯梨華照晴影暖雪正粉救把酒久浣祼況

拾攀芝平陸朱原本以條據解襟俯清池微風度修行憲

遊因分韻賦詩余得淪字

事至雍上與故人吳擇仁智夫趙子淪澄之同

遂雍上燕溪分韻作

美人懷何許癌言不相傳心寄南征濤雲漢長回首

1 Like

能放一下 视频转文字助手这个软件的下载链接吗?我搜了搜,没找到,刚才我试了试gemini和chatgpt对这两图进行ocr,效果也不太行,我以前也试过用其他工具ocr竖排的文本效果基本都不太好。

百度“视频转文字助手”,第一项就是呀。此软件功能相当多且好用,不仅仅是视频转文字!


是这个吗?主要是叫这个名字的软件太多了,不确定是哪一个。

是的!我购买了终身使用权,做过一些测试,很不错。其实这就是一个AI软件。
我也比较过几种ocr软件,包括大名鼎鼎的“扫描全能王”,发现视频转文字助手的ocr的效果是最好的,简体横排书就更没有问题了,准确率几乎100%。本来购买这个主要是为了翻译一些外国电影字幕用,购买后才发现其AI和ocr等功能更好用。权当给这个软件做点儿推广了。

用古籍酷吧,专为汉语竖版而生

Google Gemini OCR能力也不错。