建议使用abbyy管理索引ocr修订协作工作流

以HTML输出中的标签元素作为判断标准,既可以不使用表格,又可以快速查阅被自动识别为表格的页面/部分,这次扫描中的向右侧箭头也可以识别出来,还是要比纯文本优势更多,而敝人之前用纯文本输出时似乎无法导出箭头: