只有ai的最好了,,,。
FR12相对11版确实改动很大…官方区别FR 11 VS 12
补充一个11版的磁力链接,目前有效, ABBYY.FineReader.v11.0.113.164RUS Corporate/Professional + RePack
也在寻找合适的OCR软件。非常感谢楼主的实测,非常有帮助 ![]()
请问你这个验证界面是怎么能弹出来的,难道只要软件自认为没错就不会弹出来吗?那一般怎么样修改OCR之后的内容呢?
识别之后,还需要一步验证。这个就是验证的对话框(应该是没有po界好)
最近用 Sigil查看.epub內容,發現不當斷行當原因:
閱讀器上會顯示:
問題出在
![]()
把控制碼刪除,以一個空格代替,就可以除掉斷行而不造成拼寫錯誤。但得設定條件,否則會把應當斷行的部份也錯殺,造成全書都擠成一段的亂象。目前發現不該斷行的起點,都是以外語的小寫為結尾的單字,如此處的she字的e; 另外逗號, 也常出現錯斷。
解決的方法:
- 把 .epub用7-zip解開壓縮。
- 將\OEBPS\Text\底下的 .xhtml文件用正則式批次修改。
- 以Sigil將原書文件打開,刪除Text底下所有.xhtml文件。
- 將正則式修改過的.xhtml文件都加入TexT底下。
- 儲存新文件。done.
說了一堆,我想問的是:在正則式底下,怎樣下指令?
謝謝!
如果你确认所有的这种地方都应当用空格替换的话,可用正则表达式
</span></p>\n<p><span class="font6">
替换为空格
\n表示换行符。如果要考虑什么Linux系统下的换行符的话,还得考虑\r\n的场合。不过你应该用的是Windows,无需深究。
正则并不难,多用会越来越熟。但批量替换永远都有风险,需做好备份。
1 个赞


