前段时间在论坛看到过那个小工具,专门处理电子书的,其中有个小功能,可以清理OCR后每一行后多余的换行符,当时没下载,今天想找,又想不起名字了,请知道的朋友告知一声,万分感谢。
emeditor编辑软件里面的正则式就可以解决这个问题
谢谢告知,有固定的正则表达式规则吗?
这样的小工具不少,比如:天若段落排版,copy++,emeditor插件,还有这个:K2pdfopt,等等,请自行百度。
本坛参考贴: 复制pdf文字有没有方法不要断行?
1 Like
感谢朋友提供信息,已经试过了,目前感觉copy++最合适,既能清理多余的换行符,也能做全角半角转换,还能做多余的空格清理。最好用了。万分感谢。
fam-
ous
这种可以自动去除-吗
有些-是不能去除的,比如:
to-
do list
这两种情况不知道能否自动区分
这种我就不知道该怎么办了,平时我也不处理英文。