自己做了一个图片词典,还是用论坛里提供的automdxbuilder,感谢软件制作者。
逐页加了书签,并利用这个书签做了索引,还补充了个别不常用的中文的词目。
总之,英文词头是全的,中文词头是挑着加的。见附件。有兴趣的朋友可以参考。
这本书是自己通读了一遍,做成词典以后方便再查阅。
链接:百度网盘 请输入提取码
提取码:wdyi
自己做了一个图片词典,还是用论坛里提供的automdxbuilder,感谢软件制作者。
逐页加了书签,并利用这个书签做了索引,还补充了个别不常用的中文的词目。
总之,英文词头是全的,中文词头是挑着加的。见附件。有兴趣的朋友可以参考。
这本书是自己通读了一遍,做成词典以后方便再查阅。
链接:百度网盘 请输入提取码
提取码:wdyi
原书后的索引并不对应页码,而是对应小标题。而且OCR识别错误率也太高,还是手动加的效果好些。
感谢楼主,想请问下手动加的索引是指自己一个一个敲的吗,我一直想做一本西语图片词典,但是1000多页词头实在太多,不知如何处理。
你好!因为我做的两个柯林斯的书的图片词典,都不是真正意义上的词典,词头都不多,几百个吧,我逐个敲词也是为了在读后能加深印象。
我有个法英汉的图片词典,书后有全部词的索引,我试过一种方法,把这部分索引高清扫描(600dpi),然后OCR识别(用xchange pdf),中文识别的效果很不理想,基本不能用,但英法文的识别效果(包括格式,尤其是格式)还是很不错的,只需要大概校对下,便可以用到automdxbuilder的软件中。
你可以参考。
但是一般单纯的词典也不会再有索引页,这方法恐怕也不好用。
论坛上好像见有人提到过,ocr识别也能只局部识别出词头。我不懂,你可以查找下。
建议使用finereader,语言设定为英文+法文+中文,然后再试看看。
假如真的是高清,finereader的识别效果不会太差。
假如没有索引页,但是内文的词头有【】记号,识别后可以用程式抽取出来。
收到,谢谢你的分享~
嗯嗯,谢谢!finereader 听说没用过,我之前用acrobat 和foxit phantom,最后觉得xchange最好用,回头试试看finerreader~
Finereader需要大量内存才能用。同时识别两种语言都需要很多内存了。同时识别三种语言没试过,不知道行不行。
正在试用finereader 16,确实厉害,就OCR功能而言,跟其他pdf编辑软件不是一个级别的