文本识别 OCR 引擎对比

合合真是对得起它的价位,《中国古代史教程》的生僻字全对。

啊,有道结果出来了,《中国古代史教程》的生僻字同样全对,性价比爆棚。

原文超出编辑次数了,只能在这里补上。明天再汇总。

火山引擎,《中国古代史教程》的生僻字同样全对,性价比爆棚。

上述引擎的识别结果:072.zip (499.6 KB)

之前白描没用对,选"手写"识别正确率高


"其它″选项 竟然全对

1 个赞

[AI行业案例]-准确率高到没朋友的OCR APP (baidu.com)

帖子有个误导人的地方,白描是百度OCR。

不是,我看了网络请求,是有道的。

那奇怪了,白描居然变卦了,不过有道很多情况下都比百度非高精度强,也是好事吧。

现在是杂交体,文字有道,公式讯飞,表格腾讯。。。百度把它写成伙伴也是小丑了。多家兼采,降低成本,可以理解。

有道量大便宜,要我也换有道,火山。我要吹爆这两,这价位真是超值,阿里和百度中文识别都没做好,我是没想到的。

我一直怀疑,阿里是故意不把最佳研发成果公开,夸克扫描王的效果是极好的,碾压调用的API。毕竟API效果一样,那就可以复刻出无数个夸克扫描王,没人开扫描王会员了。像有道翻译也搞网页直接翻译和API的区别,相当恶心人。网页翻译效果要碾压API。我个人是拿来弄日语翻译的,区别非常明显。

1 个赞

合合,有道,火山这几个OCR结果带位置信息吗

说到数学公式的识别,夸克扫描王是独一档的,经常接触数学的朋友值得一试,转换Latex公式相当方便。扫描一整页的复杂数学式子,最多几个错误。我测试过国外的微软数学、photomath准确率都远不及夸克扫描王,像国内顶尖老牌扫描全能王(这个存在了近十年了吧,内置是合合引擎),没有专门对数学公式做支持。

都带位置信息,会给出单个字符的位置。

单行的位置呢

都会给。请求的时候要设置对应的参数,具体要看文档。

1 个赞

请问这些都是年费制度吗?不是按照单本价格收取费用吗?

全能扫描王、夸克、白描怎么收费的要去 APP 里看。我列出的价格是在线文本识别服务供应商的价格,按次(页)收费,量大的话会更便宜。

刚看别人发的白描 web 端,用的是百度的接口。 :smile:

1 个赞

样本三:留声机与清末民初的世俗文化

完整单页的对比结果:

测试图片:085.jpg.zip (700.1 KB)

此次测试总计 860 个汉字,138 个符号。

合合: 汉字 0 个错误,符号 0 个错误

百度高精度:汉字 0 个错误,符号 2 个错误

阿里高精度:汉字 1 个错误,符号 1 个错误

  • 年 // 幻觉:(全)年

有道:汉字 0 个错误,符号 3 个错误

  • ①②③ // 符号可以识别,出现 3 个错误

火山:汉字 4 个错误,符号 7 个错误

  • (阶)层 // 错字:防
  • (时)// 错字:日
  • (20) // 漏字
  • (段) // 错字:县没
  • ①②③ // 6 个符号都无法识别

上述引擎的识别结果:085.zip (708.5 KB)

合合这么强?这是哪家公司的产品