求助 为什么有的高清图片版PDF无法OCR?

类似下边这个,用FineReader无法OCR
FineReader OCR 失败 韦氏英汉双解扩词手册 思维导图.pdf (3.3 MB)
PDF Element OCR 失败.pdf (18.0 MB) , Acrobat的英文也失败,并且不支持双语的
源文件 韦氏英汉双解扩词手册 思维导图.part1.rar (20 MB)
源文件 韦氏英汉双解扩词手册 思维导图.part2.rar (15.1 MB)

1 个赞

abbyy正常进行ocr
但由于结构复杂,还有斜体什么的,ocr效果一般
又看了一下,确实有几页无法正常识别

我试了是没有一页可以正常识别

阿比很容易把它识别成图片,
要将图片区域修改成文本,才能进行识别。
这么下来,每一页基本上都 要手动操作才行。

真心不建议OCR,因为识别效果真差,

因为文件太大,你提取出几页再试试看,,,但是合不起来,因为文件更大。。。

哦哦,明白了 谢谢

您好像看错了 这个是思维导图小文件,不是原书那个八百多M的pdf 都个我用FineReader试过了能识别 只是得等大半天 出来剩下几十M,字迹有些变淡不清晰, 所以我给删了