柯林斯“隐喻(语法丛书)”图片词典 个人制作

自己做了一个图片词典,还是用论坛里提供的automdxbuilder,感谢软件制作者。

逐页加了书签,并利用这个书签做了索引,还补充了个别不常用的中文的词目。
总之,英文词头是全的,中文词头是挑着加的。见附件。有兴趣的朋友可以参考。

这本书是自己通读了一遍,做成词典以后方便再查阅。

链接:百度网盘 请输入提取码
提取码:wdyi

9 Likes

原书后的索引并不对应页码,而是对应小标题。而且OCR识别错误率也太高,还是手动加的效果好些。

感谢楼主,想请问下手动加的索引是指自己一个一个敲的吗,我一直想做一本西语图片词典,但是1000多页词头实在太多,不知如何处理。

你好!因为我做的两个柯林斯的书的图片词典,都不是真正意义上的词典,词头都不多,几百个吧,我逐个敲词也是为了在读后能加深印象。

我有个法英汉的图片词典,书后有全部词的索引,我试过一种方法,把这部分索引高清扫描(600dpi),然后OCR识别(用xchange pdf),中文识别的效果很不理想,基本不能用,但英法文的识别效果(包括格式,尤其是格式)还是很不错的,只需要大概校对下,便可以用到automdxbuilder的软件中。

你可以参考。

2 Likes

但是一般单纯的词典也不会再有索引页,这方法恐怕也不好用。

论坛上好像见有人提到过,ocr识别也能只局部识别出词头。我不懂,你可以查找下。

建议使用finereader,语言设定为英文+法文+中文,然后再试看看。

假如真的是高清,finereader的识别效果不会太差。

假如没有索引页,但是内文的词头有【】记号,识别后可以用程式抽取出来。

收到,谢谢你的分享~

嗯嗯,谢谢!finereader 听说没用过,我之前用acrobat 和foxit phantom,最后觉得xchange最好用,回头试试看finerreader~ :grin:

Finereader需要大量内存才能用。同时识别两种语言都需要很多内存了。同时识别三种语言没试过,不知道行不行。

finereader

正在试用finereader 16,确实厉害,就OCR功能而言,跟其他pdf编辑软件不是一个级别的 :sweat_smile: