算是给阿若林小姐姐的切词版新时代英汉大词典的诞生,小小助兴~~
因为用chigre前辈的软件没法ocr出来词头,但是又感觉其实使用Abby ocr效果会更好,所以开始另寻他法。
第一种方法是一页一页来,插入到red ocr.txt 文档中,然后用chigre软件ocr选第二个选项即可填词。但是一页一页来毕竟效率不高,索性再次另寻他法。
第二种方法是阿若林小姐姐的脑洞,在此感谢阿若林小姐姐!就是用python获取单词切片(用来专门ocr)的名字,(因为单词切片名称包含了单词所在页面信息)或者使用bat批量获取图片名字,两种方法均可。这样做的目的是将abby ocr出来的词头和页码产生关联,之后生成wordslist.txt文档,可以直接填充到chigre前辈的软件中,直接进行校对即可。(前提是画好线)
一切都是理论上可行,实际还没有操作。
PS:abby用html保存较好,因为有格式后期正则直接提取出来词头即可。