如何校对双层PDF的文字层?

利用Adobe\Finereader等软件工具的OCR功能创建双层PDF,但由于OCR有很多错误,所以文字层需要经过校对和修改,请问有没有具体的教程和工具来做这个工作呢?

就用Finereader这个校对

2 个赞

上传一份pdf例子来说吧,节选10页-2页即可。

一般的,在abbyy finereader 16里面就内置了校对。
但是ocr后,对于少量识别错误问题可以手工校对,若ocr错误很多,校对就没有必要了吧。

曾经尝试过,但感觉并不好用,校对完成后保留的文件变得十分模糊

我之前识别后保存pdf不是双层,只剩下识别后的文字了,不知道怎么回事。

可能你的ocr选成了“可编辑的图像”

谢谢,我找个机会再试试看。

macOS可以用PDF Expert,有非常方便的校对功能,只是它的OCR会导致文件急剧膨胀,最好Acrobat识别,PDF Expert校对

借问一下,如果已经ocr成了文本pdf,有没有办法把文本版和图像版合并成双层?要不还得重新ocr一遍。

也关心,这个要是解决了就可以在图片上戳了、就看过乔治、和hua弄过