楼上没说全,abbyy还有一个长处,是你滑鼠光标停留在文本层中某一待修改字符前后处时,下方会有一个窗口迅速追踪定位到图片层对应字符所在行,勘误效率提高不少。同时,还可以借鉴WPS审校的异源文本的复叠校对,在同一个窗口通过删除线下划线不同字体颜色直观呈现不同ocr文本的字句差异,再辅以WPS所不具备的自动批量替换功能就更好了,比如A版ocr文本惯作“毒”字,B版ocr文本惯作“毐”字,可以进行预置性的批量订正(准替换,仍保留A/B版本的差异字符,只是通过不同字符底层色块体现字符订正),不仅当前校对页面点击差异字符组中的正确字符进行判定标记,随着校对推进,当跳转到其他同样差异差异字符组时,也已经预置性地对同差异字符组的正确字符进行判定标记。这时候可以根据上下文迅速判断是否准确,若正确的话不同再点击修正,减省鼠标点击操作。做到这几点,再完善本地存储功能,就差不多到商业级应用了
感觉补充!令我自惭形秽的描述能力。
嗯嗯,wps支持的。目前来看abbyy和wps都有一些功能难以取代啊 ![]()
等abbyy哪天发布17把ocr引擎换成AI吧,现在abbyyocr单一语言还勉强能凑合着用。
识别结果要看引擎啊,paddleocr识别率还不错,这个工具主要功能是对比校对,不是识别。
不太现实,abbyy近些年的迭代更新都是挤牙膏 ![]()
txt有格式要求的,每页前面必须有<1> <2>这样的页码标志,否则程序不知道是第几页,而且页码要对应,比如你这个第71页才是实际第1页,设置的时候页码偏移就要填71-1=70
竖排繁体,WPS和AI本地工具效果都不太好。
要求高的可考虑收费的合合。
或者可以用 abbyy 试试看







