写了一个OCR文本和图像的三方对比校对工具 (6.1更新支持paddleocr 1.6)

楼上没说全,abbyy还有一个长处,是你滑鼠光标停留在文本层中某一待修改字符前后处时,下方会有一个窗口迅速追踪定位到图片层对应字符所在行,勘误效率提高不少。同时,还可以借鉴WPS审校的异源文本的复叠校对,在同一个窗口通过删除线下划线不同字体颜色直观呈现不同ocr文本的字句差异,再辅以WPS所不具备的自动批量替换功能就更好了,比如A版ocr文本惯作“毒”字,B版ocr文本惯作“毐”字,可以进行预置性的批量订正(准替换,仍保留A/B版本的差异字符,只是通过不同字符底层色块体现字符订正),不仅当前校对页面点击差异字符组中的正确字符进行判定标记,随着校对推进,当跳转到其他同样差异差异字符组时,也已经预置性地对同差异字符组的正确字符进行判定标记。这时候可以根据上下文迅速判断是否准确,若正确的话不同再点击修正,减省鼠标点击操作。做到这几点,再完善本地存储功能,就差不多到商业级应用了


像这种页面文字和符号都能准确识别吗

感觉补充!令我自惭形秽的描述能力。

定位到图片层对应字符所在行这个要看ocr引擎能不能返回行级别的结果,paddleocr不支持,有些传统的ocr引擎支持。
重叠校对9楼的版本实验过,但这个模式是不支持直接编辑文本的,因为非常容易出bug,wps在这个模式支持编辑文本吗?目前没合并到主分支

然后预替换这个不支持,但预览窗口是支持类似功能的,就是搜索差异功能,比如中日字体差异对対


选review diff后会弹出预览窗口,然后打勾的是要替换的,会显示上下文,然后双击其中一条可以定位到所在页的位置

嗯嗯,wps支持的。目前来看abbyy和wps都有一些功能难以取代啊 :sweat_smile:

等abbyy哪天发布17把ocr引擎换成AI吧,现在abbyyocr单一语言还勉强能凑合着用。

识别结果要看引擎啊,paddleocr识别率还不错,这个工具主要功能是对比校对,不是识别。

不太现实,abbyy近些年的迭代更新都是挤牙膏 :rofl:

更新新版本 0.6.10,修改配置选项,现在paddleocr不需要填写url了,只需要填写token,自动支持v1.6 v1.5 ocr和ppstructure,采用新的异步api,可以选择重试次数和并行任务数。

furigana功能在安装jamdict的情况下可以自动分词,给每个字添加注音。

更新新版本 0.6.11,增加词头对比工具和页面相似度对比工具,用于检查ocr质量

求教,在我电脑上怎么加载不了txt?

txt有格式要求的,每页前面必须有<1> <2>这样的页码标志,否则程序不知道是第几页,而且页码要对应,比如你这个第71页才是实际第1页,设置的时候页码偏移就要填71-1=70

竖排繁体,WPS和AI本地工具效果都不太好。
要求高的可考虑收费的合合。
或者可以用 abbyy 试试看