英文词典词头索引

英文词典词头索引

只收词头和词头出处,不带任何其他资料。我是做来校对英汉词典用的。不提供客制化服务。我是个固执己见,不爱听建议的人。想要别的形式的数据的人,请自己动手做。

我先声明:这不是严格的有学术价值的词典词头,没有校对过。这只是一些mdx词典的词头的合集,大概会有各种各样的错误,只能凑合将就使用。

假如有人在使用中发现错误,欢迎指出来,但我不一定会改了重发,大家得学会自己修改。

1.英文大词典词头索引
一共收了8个英文大词典的mdx的词头,去重后有759,833条。作为比较,最大的英文词典据说是English Wiktionary,有780,489条。

[ahd]: American Herritage Dictionary (收主词头+跳转)
[ced]: Collins English Dictionary (收主词头)
[mw]: Merriam-Webster (收主词头)
[ode]: Oxford Dictionary of English (收主词头)
[oed]: Oxford English Dictionary (收主词头)
[rhw]: Random House Webster (vocabulary.com版。收主词头+跳转。专名都是小写的,很讨厌,但是没有精力改。)
[soe & otd]: Shorter Oxford English Dictionary + Oxford Talking Dictionary (收主词头)
[wnid]: Webster’s Third New International Dictionary (收主词头)

档案一共两层包裹,第一层是加密的zip文件,解开后得到mdd,再用mdxexport解开mdd,得到两个文件:ywidx.mdx、ywidx.css。

1.ywidx.zip

解压密码和本坛有关。

提示:把freedom译成中文(两个字),再把这两个字变成汉语拼音(不带调号,字母间没有空隙)。一共5个英文字母。

配图

[ywidx.zip|attachment](upload://b9gMrufntO5K4LM1LynRtESML6H.zip) (9.9 MB)

2.ywidx.mdd
解开ywidx.zip后会得到ywidx.mdd。用mdxexport解开mdd。工具和使用方法见:《新手指南:怎样编辑mdx?》

解开ywidx.mdd会得到两个文件:ywidx.mdx、ywidx.css。放在同一个文件夹中使用。

我只用Goldendict-ng测试过。

4 个赞

2.英文词典常收词

做完了这个《英文大词典词头索引》,我想到一个问题:这8个英文大词典都收的词语有多少个?都是哪些词?

上面的mdx挺难搞,搞到Emeditor都崩溃了好多次。

但是这个《英文词典常收词》不过是上面的mdx的子集,很好做。用Emeditor的“extract”抽出来就是了。

8本词典都收的词:33218条。

ywidx2.zip

配图

[ywidx2.zip|attachment](upload://7qtD7bY02WGqbq54FPUxCny0I7F.zip) (277.3 KB)

有些词看起来很深奥,不都是常用词,所以只能叫“英文词典常收词”,不能叫“英文词典常用词”。

压缩档的密码和主楼相同。

压缩档里有三个文件:ywidx2.txt、ywidx2.css和MdxBuilder.cfg。

没有编译好的mdx。

我想鼓励不会做mdx的坛友自力更生,所以不发编译好的mdx。

把MdxBuilder.cfg复制到mdxbuilder的文件夹内,覆盖原有的MdxBuilder.cfg。这样可以节省一点思考参数的时间。当然,还是得用文本编辑软件打开mdxbuilder,修改ywidx2.txt的路径。

假如你懒得改文件路径,可以在d盘开一个tmpmdict文件夹,把ywidx2.txt丢到里面去。

假如文件路径和cfg一样,就什么也不必改。

Setting InputFile=“D:\tmpmdict\ywidx2.txt” OutputFile=“D:\tmpmdict\ywidx2.mdx”

接下来,启动mdxbuilder,用mdxbuilder把ywidx2.txt重新编译为ywidx2.mdx。

把ywidx2.mdx、ywidx2.css放在同一个文件夹里使用。和上面的mdx放在一起是可以的。

1 个赞

预留楼层2,有待增补。看有没有兴致。

预留楼层3,有待增补。假如非常有兴致。

在2楼增加了一个《英文词典常收词》的数据,mdx格式,假如觉得有用,可以自己编译为mdx。