【疑难词目(词头/条头)索引制作求助】请各位前辈指教如何从这本《拉汉科技词典》提取词头和对应页码?

淘宝的文本校对,是校对词头还是全文校对

希望可以在论坛发起项目,招募人选,先ocr,然后校对文字,最后总成。完成后可以先在参加人选中分享。

后续讨论请见私信群邀请~

后续讨论请查看私信~

请其他有兴趣而未接到私信邀请的坛友点一下,方便我邀请大家一起讨论(之前的投票不懂设置“显示投票人”,看不到谁投了呜呜)

  • 请邀请我讨论
0 投票人

(帖子已被作者删除)

待看商家制作的样章,后续如果讨论不承包给商家决定我们自己做的话,我可以帮忙切图。

校直纠斜可使用【交流】图片词典制作 - 技术交流与词典编修 - FreeMdict Forum 提到的Abbyy FineReader操作

切图可使用【阿彌陀佛】手把手教你做切图词典(单栏)[教程] - 技术交流与词典编修 - FreeMdict Forum 提到的图片工厂操作

2 个赞

不做切图词典还裁切个啥?
直接用看图软件截屏录制动作调用OCR接口就完事了,一天能校对多少就弄出来多少。
既然整本的电子化了就不用研究图了

他意思应该是把多栏的图片,切成单栏的。方便调用在线OCR

目前的在线OCR服务,我只知道谷歌OCR默认可以处理多栏图片(整体效果还可以,但可能会有误处理,导致不同地方的文字连接在一起了。最靠谱的还是切出单栏来,再OCR)
百度OCR直接趴窝

已经简单切成单栏,有需要可以取用。

提取码:w0iA

2 个赞

密码呢???

提取码:w0iA

分九个PDF文档OCR,附文档及原件,没有校对只是单纯OCR,有需要自行取用。

提取码:E5RO

4 个赞

这个OCR正确率挺高,很不错:+1:,能问下是啥软件吗,有没有类似ABBYY这样的校对窗口:

这样校对会比较方便,高亮嫌疑部分,并且指哪打哪,可惜ABBYY就是正确率感人:person_facepalming:

2 个赞

非常感谢你的分享,你的ocr效果非常好,打算就把你的当底本。夸克永远的神,碾压一众ocr接口。
:+1::+1::+1:

1 个赞

夸克扫描会员批量扫描,没有实时校对页面。

2 个赞

请教下,夸克扫描开了会员后,批量扫描是怎么收费的?只看到一个䗴字错误, 这正确率好高。

OCR 结果能直接输出为TXT 文体吗,我尝试将 .doc 另存为 .txt 丢失了缩进信息,不知你那源头上有没有解决这个问题的直接办法

1 个赞

试试这个来校对

2 个赞