【全量提取+精排】Chambers 21st Century Dictionary

这本词典前几天 @random已经做好了,我这个虽也是那时起工的,但完成得晚些,主要是因为做了做了全部 derivativesphrasal verbsidioms(也就是词条中所有粗体和蓝绿色部分)的提取,当然,不过由于处理和具体情况的综合考量,并没有将片段从词条中提取/分离出来,也就是所有检索结果都是整个词条,这点可能有人会不喜欢觉得效率低,因此,如果你更偏好分离版,可使用random兄的版本,各有优劣。

词典的完成首先得感谢 @hua 对软件数据的提取,另外还有 @random 的帮助。先放个成果图给大家看看:

改进说明

下面列几点最主要的改进,其他细枝末节就不提了,自行使用中体会:

  • 提取了全部 derivativesphrasal verbs idioms 。这是最大的改进,也就是最难的,批处理加手工校正,太不容易了,这几天一有空就坐下来提取。具体提了多少呢,你可以看看词典背面的 info;
  • 去除字体的依赖。其实真正使用到原本那个字体的就只有音标部分,现在所有音标已经改成标准的 Unicode 字符了;
  • 优化了排版。做为个人喜欢的词典,排版一定要合心意才行,当然,是在原配色和排版的前提下,因为个人比较喜欢原汁原味的配色,这样在众多使用的词典中也好区分。

最后,说明下词典使用的两点:一是词汇并没有提取到百分百,但应该有95%以上,并且不可避免可能会有少许错误;二是词条每个都是完整的从软件中搬过来的,处理的只是排版,内容软件是怎样就是怎样,如果觉得那里内容有问题可以对照纸书比较下。

资源

只在 MDict 和 GoldenDict 上测试过,其它软件应该也没问题:Chambers 21st Century Dictionary.zip (6.3 MB)

20 个赞

词典知识整理:The Chambers Dictionary 与 Chambers 21st Century Dictionary

The Chambers Dictionary(TCD)是本历史悠久的词典,首版于1872年 by W. and R. Chambers。其收词量巨大,十几万,属于 unabridged 级别的词典。最大的特色是收录了很多 dialectal, archaic, unconventional and eccentric words ,而被英国 crossword solvers and setters 等词汇爱好者广泛使用。

Chambers 21st Century Dictionary 的前身则是1901年出版的 Chambers’s Twentieth Century Dictionary(当然21dt并非是在20th基础上的修订,编制人员完全不同),词头约五万,这两部词典都秉承现代、简练、实用的编纂理念。虽然词典的篇幅、词头数量都不及TCD,但也并非是TCD的子集,而是分别满足不同需求(两者类似于小一号的W3和韦氏高阶)。

6 个赞

有时间一定从头到尾看一遍。

1 个赞

Chambers 21st Century DictionaryChambers 20th Century Dictionary 其实并没有太大的关联,The Chambers Dictionary 系列才是 20th 的继承。21 st 只是风格上秉承了 20th 释义简明的理念,以及结构编排上差不多,但内容上完全不一样,是全新的编写(或者基于其它词典也说不定,反正不是 20th)。

它取名为什么叫 21st 呢,估计是为了蹭 20th 的名气,提高销量。Chambers 的词典取名很谜,在 21st 后基于它还出了个叫 Chambers Concise Dictionary(所以 21st 也就不是孤本了),打 20th 升级版的幌子没骗过去,换个名字又来蹭 The Chambers Dictionary 的热度?

当然,不是说这本词典不好,反正我个人还是挺喜欢的,既有释义简明、中肯的特点,又有独到的语言风格,另外词典中对单词的每个释义是单列到具体语义/使用情境的,这与一惯的许多词典释义常使用「;」分隔多个语义不同,当然,不能说哪种就绝对好,各有用处。

The Chambers Dictionary 系列当然一直很受母语使用者欢迎,释义极度的精炼,具体表现可以看到基本上是通过 thesaurus 来释义 headwords 了,这对使用者本身语言掌握要求较高,否则很容易用得一头雾水。个人感觉目前不太适合自己,21st 则恰到好处,比较贴近 ESL。

那既然 21st 挺不错为什么还要靠各种挂靠呢?或许是 20th 太耀眼了吧,但大部分真正用过 21st 的都还是觉得这是本好词典。

7 个赞

感谢楼主制作分享

感谢楼主的分享

1 个赞

现实中很难在庞杂的释义文字中锁定目标短语。
除非只有一个词典,通过检索的方式定位。
多个词典并行使用,楼主的方案效率低,无法达到设想的预期

1 个赞

我也觉得,奈何水平有限,不知能否劳烦大侠帮忙改进一下

1 个赞

我也看不下去了,你嫌楼主方案效率低你别用啊 总在那一个个帖子去指点江山,你自己到底会点什么?

提改进建议可以,但是你说话方式让人很不爽,嫌这个嫌那个的。。。。

5 个赞

对于这种中小型词典,lz的做法是查询效率最高的。上下文一目了然。
感谢 Mandolin

3 个赞

楼主您好,感谢您的分享,我也觉得Chambers这部词典非常好用,我已经将它转换成了Mac内置词典的格式,格式我都修改好了,只是现在有一个问题,就是在mac下三指查词,只有部分复数,过去式等单词是可以查到的(如inclusions,distribued),常常会有查不到的情况出现,但是如果在欧陆,或者mac自带的词典app下查询都可以查得到。看您对这个问题有没有思路?如果可以解决的话,我会将这部词典转换好,发到该帖下面。

做Mac词典就是这样啊,大多数教程只说了怎么从mdx转换到Mac格式,但远远达不到完美。
现在半年过去了,如果你有解决方法了欢迎分享。。

查词时发现为数不少的遗误,盼 @Mandolin 兄台可否拨空再修正一下,谢谢

没看明白,啥意思?


21C…6 是词条编号,不是错误,Aaron’s rod 也可以查

不解仁兄留下编号的特殊用意,为何不直接的用词头代之 :grinning:

原光盘数据就带有编号,保留了,并且因为关联到跳转,不能删

原来如此,谢谢兄台解惑 :grinning:

In goldendict it shows an error, saying the mdx is corrupted. It works in mdict though.

*Golden dict bug:
I renamed the folder to the previous version of this dictionary and golden dict couldn’t read it. Then renamed it to something else and it worked. It is probably a bug in Goldendict.

1 个赞

remove all indices generated by goldendict and restart.

That would be lots of work. I managed to get it work by just renaming the folder 2 times. thanks.