谷歌OCR Vs. 合合OCR

更新一下最新比较(2024年9月30日):

谷歌的DocumentAI今年八月份更新了一个OCR处理器版本后,中文识别准确率提升了不少,可以媲美合合了,有些场景甚至完全超越了合合OCR。英文识别更是超越国内所有OCR服务!

谷歌新的OCR处理器版本:
image

谷歌OCR(DocumentAI)和合合OCR(通用文档解析)效果实测对比:

Google DocumentAI 我愿称之为地球最强OCR :grinning:
而且价格实惠,仅为合合OCR价格的10%
简直良心。

补充一下:
谷歌最近推出了几个高级特性,比如判断font style等等,价格涨了4倍,如果开启这些高级特性,比如用来提取黑体词头,综合价格就接近合合的价格了,不过还是更便宜一些。

p.s.
经last_idol提醒,合合的“通用文档”只包含下面几种类型:
支持标准的金融报告、国家标准、论文、企业招投标文件、合同、文书、工程图纸等文档内容。
可能不支持上面的普通电子书PDF,所以识别准确率差。

不过只支持上面几种文档的话,我觉得不适合叫“通用”文档解析,应该改为“特殊文档解析”比较恰当。

p.p.s

用合合的“通用文本识别”接口,可能会大幅提高准确率,但因为我没有这个接口的额度了,暂时无法测试验证。

2 Likes

谷歌Document AI的api太难用了,各种文档跳了几十个页面,都不知道在说什么,严重官僚化和形式主义。

确实。不过都有示例代码,可以拷贝下,也可以问下Gemini或者ChatGPT

DocumentAI的好处是可以配合谷歌的云存储,直接把PDF传到云存储里,然后再OCR,这种OCR超多页文档的时候,比本地一页页上传-OCR模式快很多,尤其是考虑到国内OCR都设置了QPS限制(每秒最多OCR1页等等),几万页的文档的话,慢慢等吧…

不过单文档页数有限制,好像500页,几万页的PDF,需要拆分成多个PDF,每个400页即可,然后上传到谷歌云存储进行OCR即可,比国内OCR快很多倍

請問價格分別為多少?

1.5美元+6美元(高级特性)+云存储费用+消费税