更新一下最新比较(2024年9月30日):
谷歌的DocumentAI今年八月份更新了一个OCR处理器版本后,中文识别准确率提升了不少,可以媲美合合了,有些场景甚至完全超越了合合OCR。英文识别更是超越国内所有OCR服务!
谷歌新的OCR处理器版本:
谷歌OCR(DocumentAI)和合合OCR(通用文档解析)效果实测对比:
Google DocumentAI 我愿称之为地球最强OCR
而且价格实惠,仅为合合OCR价格的10%
简直良心。
补充一下:
谷歌最近推出了几个高级特性,比如判断font style等等,价格涨了4倍,如果开启这些高级特性,比如用来提取黑体词头,综合价格就接近合合的价格了,不过还是更便宜一些。
p.s.
经last_idol提醒,合合的“通用文档”只包含下面几种类型:
支持标准的金融报告、国家标准、论文、企业招投标文件、合同、文书、工程图纸等文档内容。
可能不支持上面的普通电子书PDF,所以识别准确率差。
不过只支持上面几种文档的话,我觉得不适合叫“通用”文档解析,应该改为“特殊文档解析”比较恰当。
p.p.s
用合合的“通用文本识别”接口,可能会大幅提高准确率,但因为我没有这个接口的额度了,暂时无法测试验证。