柯林斯“隐喻（语法丛书）”图片词典个人制作

Celestin · 2023 年12 月 17 日 01:26

自己做了一个图片词典，还是用论坛里提供的automdxbuilder，感谢软件制作者。

逐页加了书签，并利用这个书签做了索引，还补充了个别不常用的中文的词目。
总之，英文词头是全的，中文词头是挑着加的。见附件。有兴趣的朋友可以参考。

这本书是自己通读了一遍，做成词典以后方便再查阅。

链接：百度网盘请输入提取码
提取码：wdyi

Celestin · 2023 年12 月 17 日 01:27

原书后的索引并不对应页码，而是对应小标题。而且OCR识别错误率也太高，还是手动加的效果好些。

Santi · 2023 年12 月 17 日 01:44

感谢楼主，想请问下手动加的索引是指自己一个一个敲的吗，我一直想做一本西语图片词典，但是1000多页词头实在太多，不知如何处理。

Celestin · 2023 年12 月 17 日 07:04

你好！因为我做的两个柯林斯的书的图片词典，都不是真正意义上的词典，词头都不多，几百个吧，我逐个敲词也是为了在读后能加深印象。

我有个法英汉的图片词典，书后有全部词的索引，我试过一种方法，把这部分索引高清扫描（600dpi），然后OCR识别（用xchange pdf），中文识别的效果很不理想，基本不能用，但英法文的识别效果（包括格式，尤其是格式）还是很不错的，只需要大概校对下，便可以用到automdxbuilder的软件中。

你可以参考。

Celestin · 2023 年12 月 17 日 07:05

但是一般单纯的词典也不会再有索引页，这方法恐怕也不好用。

论坛上好像见有人提到过，ocr识别也能只局部识别出词头。我不懂，你可以查找下。

shaoshi · 2023 年12 月 17 日 07:07

建议使用finereader，语言设定为英文+法文+中文，然后再试看看。

假如真的是高清，finereader的识别效果不会太差。

假如没有索引页，但是内文的词头有【】记号，识别后可以用程式抽取出来。

Santi · 2023 年12 月 17 日 07:17

收到，谢谢你的分享～

Celestin · 2023 年12 月 17 日 07:51

嗯嗯，谢谢！finereader 听说没用过，我之前用acrobat 和foxit phantom，最后觉得xchange最好用，回头试试看finerreader~

shaoshi · 2023 年12 月 17 日 08:24

Finereader需要大量内存才能用。同时识别两种语言都需要很多内存了。同时识别三种语言没试过，不知道行不行。

finereader

Celestin · 2023 年12 月 19 日 07:00

正在试用finereader 16，确实厉害，就OCR功能而言，跟其他pdf编辑软件不是一个级别的

柯林斯“隐喻（语法丛书）”图片词典 个人制作

柯林斯“隐喻（语法丛书）”图片词典个人制作