CECD2024

Cambridge English-Chinese (Simplified) Dictionary
https://dictionary.cambridge.org/dictionary/

这本词典有义项归类,还有导航词提纲挈领,感觉拿来做快查词典应该不错吧。于是就做了一版。仅供测试

顺便对习语做了整合:


历史版本

2024-03-07

  • 移除guideword前面的背景
  • 点击词头折叠时把更多例句也叠上

2024-03-10:


下载地址2024-03-10

CECD2024.7z.001 (20 MB)
CECD2024.7z.002 (19.9 MB)

40 个赞

Thanks for all your beautiful dictionaries.

不要停,继续发。

超赞!Sunny做的词典非常优雅,排版在内容输出和颜色上也很克制。单词头下面还做了其他词头的条目合并,比原网站还好用,太强了(比如as下面还会有Symbol的As条目)
请教一下两个技术问题:全量wordlist你是怎么定义出来的?条目合并用什么条件来判断实现?

哥们儿这个词典做的太棒了,不麻烦的话想问下,如果我想把英文释义直接显示到中文后面,在css里面需要加点什么?

2 个赞

顶一下,我也比较期待双解快查!!哈哈
我现在的习惯是鼠标取词用快查,详情用完整词典

robots.txt里面有sitemap(一个善意且自觉的爬虫会先看看robots.txt)。顺着sitemap跳一两层,一般就能得到完整的词表。也有例外的情况,比如麦克米伦在关站前的一段时间对网站的维护有点敷衍,sitemap里就缺了一些词。还有的网站不提供sitemap,只能通过其它方法获取

没有固定的方法,都是根据网页的结构总结规律,需要什么条件就加什么条件。这是个非常繁琐的过程,就是不断找标签,对齐标签。(在处理剑桥的数据时遇到了很多问题,感觉和即将关闭前的麦克米伦有得比了)

css找到503行,是关于.cec-hide .def 的隐藏,删掉这行即可。 不过,这样做和例句切换版有什么区别么?

你听过Emo同学的心得吗?“英文释义对于一个追求快查的词典来说,是破坏性的。它凸显了更多细节又能怎样?你丢掉了速度,牺牲了节奏,孰重孰轻啊” :stuck_out_tongue_winking_eye:

2 个赞

感谢Sunny指导! :smiley:
有些网站甚至连robots.txt都没有 :joy:

有点惶恐,谈不上指导。 如果连robots.txt都没有,那就用你自己手里的词表去碰运气,抓不全也没关系,它不在你的词表里,对你来说可能也没那么重要了

image
有什么办法可以把cefr信息匹配到整个释义div的属性里吗?正则好像不大行
cefr资源还是比较稀缺的,这样就有种数据库的感觉了,可以抽出各种级别想要的信息

这款词典有个惊喜,就是虽然剑桥记录的主词条大多是英式英语,但是在查美式拼写的时候也会直接导过来,就不需要重新输入英式拼写或是增加另一款词典了 :doge_gif:

漂亮!
原数据一处问题。

已加上,更新在一楼

我也遇到过。 还有些派生词单拎成条时把相同的例句重新翻译了一遍,译文也简繁混杂,感觉他们编撰时没有统一的调度,看看以后怎样吧

4 个赞

Thanks for useful updates.

This idiom doesn’t show its definition.

Words or phrases that are displayed in italics indicate that they are not included in this dictionary (CECD).

It’s about 15% of the total

2 个赞

好像查不到refer这个词。

因为剑桥英汉词典官网就没有refer这词的页面,在官网查refer会跳转到cross-refer

1 个赞

真的太完美了,太漂亮了。
感谢楼主的付出。
不过楼主有没有考虑过做一下剑桥的theasaurus和collocations呢?个人感觉这个是这套词典一个很大的优点。
本站的leon406做过,但是在欧路上的体验比较糟糕,而且不再维护。
另外,听说这个英汉官网的数据比较老,可否试试爬英英官网的做个英英版?

1 个赞

My request is same for complete Cambridge English English dictionary if master @Sunny1 don’t mind. Thanks in advance

1 个赞