CED &Thesaurus Boxed Set(4.16 update)

collins同反义词词典套装,epub格式转制
4.15添加词头变体提高查得率
4.16修复正确的词头变体



ctde.css (1.8 KB)
ctde.mdx (2.0 MB)



casd.css (1.8 KB)
casd.mdx (2.3 MB)

24 Likes

多谢,辛苦了。

3 Likes

Thank you very much with depth of my heart :heart:. Thanks again

3 Likes

附上epub文件,供有需要的学友直接下载
Collins_English_Dictionary_and_Thesaurus_Essential_Collins_Dictionaries.epub (2.7 MB)

感觉mdx里1930个形如下面的重定向是多余的,只会让词条cho重复显示。

abominable_snowman
@@@LINK=abominable snowman
</>

原epub里倒是可以提取出一些拼写变体。如

eon
@@@LINK=aeon
</>

楼主可以改改,近一步提高查得率
@@@LINK.txt (28.7 KB)

2 Likes

这个处理,是因为带空格的词条,其超链接就是带有下划线的,如果不加这个,你在其他词条无法正确跳转到该词条,虽然可以把空格去掉,但是还是加这么个东西吧,多不了多少体积。
发现原来的超链接里面也没有加下划线,所以直接去掉这些多加的重定向

2 Likes

:sweat_smile:才发现一个词条有多个变体,等重新提取吧

3 Likes

thesaurus似乎[8.12] Collins CED & Thesaurus 2020更胜一筹,二者基本一样,但是此前那个,部分thesaurus是有释义的,并非简单罗列,词条也多了八千。

6 Likes

楼主你好,我想做一本中国文学鉴赏辞典唐诗,epub格式,的mdx词典,我理想状态是,作者,诗名,诗句,作为词头,作者词头包含该作者的诗名跳转,mdx包含csshtml格式,方便后期css美化,那么如何效率的转制,效率的附上格式呢
求制作中国文学鉴赏辞典大系(套装共17部22册)mdx

1 Like

如果本身是格式良好的文档,使用python的beautifulsoup结合正则表达式来做应该可以,参考这个
https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/

1 Like

可以上传到阿里云网盘吗?这个盘速度太慢了

楼主注意一下,提取的词头变体并非都是完整的单词。

变体来源于词条里面多个定义的词头,所以一定会链接到该词条
查了下词才明白你要说什么,真是坑人啊,再看看怎么处理

中国文学鉴赏辞典大系(套装共17部22册).part1.rar (20 MB)
中国文学鉴赏辞典大系(套装共17部22册).part2.rar (20 MB)
中国文学鉴赏辞典大系(套装共17部22册).part3.rar (20 MB)
中国文学鉴赏辞典大系(套装共17部22册).part4.rar (20 MB)
中国文学鉴赏辞典大系(套装共17部22册).part5.rar (20 MB)
中国文学鉴赏辞典大系(套装共17部22册).part6.rar (8.9 MB)

1 Like

链接:https://pan.baidu.com/s/1vKqfzOSxpqBoPOd4zM8Gsw
提取码:vtm4
–来自百度网盘超级会员V8的分享
我阿里没有会员,显示文件过大,无法分享

可惜是Essential Edition(精简版)的,要是无删节版的就更好了。

「Collins English Dictiona…& Thesaurus.mobi.pdf」阿里云盘分享
点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看,视频原画倍速播放。

1 Like

这本怎么啦?不是有现成的吗

你看看里面提到的2015版,似乎比作者的好

1 Like

有没有epub版?我电脑转换半小时了还在转,是不是加密的?不是epub解压不了哦,需要解压里面的资源