我猜测唯一全的版本是chigre这一本。假如能找到,值得修一修。
chigre3: 现代汉语词典(汉英双语)2002年增补本 切图版
https://061061.xyz/32394.html
楼主找的是这一本,不全。
[汉英] 现代汉语词典(汉英双语)
https://061061.xyz/13912.html
不全的版本本坛也有。
现代汉语词典(汉英双语)完整版
需要pdf的可以使用:
K大:【高清PDF】现代汉语词典(汉英双语版)
链接:https://pan.baidu.com/s/1g0dYpE6RA_QqL2u09e9-vQ
提取码:r4iz
按:这是K大的链接。过期了别问我,我用不了百度盘。
Vim
27
理论上:
1、词条有现成的:直接拿《现代汉语词典第7版》,两者吻合度很高,估计至少90%以上。
2、剩下的只是将页码对上:双语版有单字目录,可以直接ORC快速获得,这个正确率还是挺高的
3、使用python等工具将1和2匹配即可获得单字的页码,同时将词组全部用单字的页码简单代替即可,然后通过每页的首字词的页码来最后纠偏,即可获得全本准确的词条和页码。
4、有了词条及配对的页码,使用图片词典制作工具即可快速完成制作。
《现汉》有13000多单字,除非人工给字对上页码,否则ocr错误率挺高,工作量不小。
我个人认为:这个双语版的价值在于:把《现汉2》那些没有解释的参考词也翻译了,是普通汉英词典没有的,所以隐藏的词汇量挺丰富。词典后又补充了一批新词,是《现汉5》才有的。
其实不需要chigre的mdd,有mdx(或者词头页码索引)就行了。K大发过高清版的pdf。
有书友说得到过chigre的mdx,但是删了。
假如有书友电脑里还有这个mdx,但是不方便发mdx,只把词头页码索引发出来,如何?
Vim
29
要OCR仅仅是几页目录,准确度很高,工作量也不多。
Vim是此中老手,经验丰富,假如愿意出手做,自然再好不过。
企盼!
我连K大的高清版pdf也没有,手上的pdf不清晰。我的finereader是第11版,也旧了。我是无法做。