非常感谢!没想到有人这么快回复。看到这个帖子里提到它是来自.dsl文件。介绍中好像还是没有说明“xxx is used with these nouns as the subject/object”这部分来源。上面@kadioguy 贴出的截图是原版词典(是PC版?可惜现在似乎找不到了),里面有这样的标注。所以应该还是来自该官方的collocations词典。
另,现在oxford collocation在线版的词典https://www.oxfordlearnersdictionaries.com/definition/collocations/,把这部分取消了?有点奇怪。
多谢多谢!
eudic
46
打开帖子,info就写了标题: Oxford Collocations Dictionary for students of English 2nd edition
那是正版词典书附赠的光盘
1 个赞
lgmcw
48
根据楼主的版本微调了一版默认非折叠版,供参考:
Oxford Collocations Dictionary.mdx (6.0 MB)
OCD.css (4.6 KB)

2 个赞
L兄暂别的这一段时间,其实有最新牛津英汉辞书的数据在流传(我没有,因为不懂SQL),可惜好像只有短语动词的(以前没有这个)放了出来。
目前这些旧版的OCD其实有不少HTML标签错误,要是拿最新版的OCD好好装饰一下就好了
1 个赞
amob
51
英文版和双解版数据不一样的,内容比双解版多。(估计你没认真看过,英文版多了名词搭配,收词更多)dsl转的mdx,就不知道dsl数据源是什么,可能是有个公开免费网站(看起来像盗版),也可能是光盘。
真想要完美版,可以考虑官网爬虫试试,就是需要买原版书激活(也可以直接买十英镑的激活码)。说来都上线接近十年了,没人爬过。
英汉双解版基本没什么问题了,用不着折腾。karx改版的还有什么不足吗?
1 个赞
amob
52
牛津英汉辞书数据只有更新牛10的,别的没区别,牛10最新翻译早就合并到现有的mdx了。
amob
54
那你找到哪里有问题么,麻烦请发出来给karx反馈吧。
讨厌补全插入可以把js删了,毕竟原版就是省略。别人重新做可不一定有这个功能。
1 个赞
lgmcw
55
其实我还挺喜欢Karx ~这个的,不知道有没有精力再做一份英文版带~的
2 个赞
Karx ~这个OCD基于彩虹版,来源于PDAWIKI时代的旧版本牛津英汉辞书。彩虹版不知道是不是提取sqlite的时候有问题,有些标签没有正常闭合,导致比如中划线本应只穿一两个错误用法的单词、结果穿了好几行的情况,不知道后来的各种修改版把这些BUG改正完了没有。
而“20240311 牛津短语动词词典(英汉双解第二版) 从数据库提取” 是本论坛提取目前新版APP的数据,数据质量比旧版APP会有所改进。
bud
57
没对比过数据是否有变化,我一直在用辞书APP。需要的话,我把数据库发给你。
amob
58
ocd有错误用法么,你说的是牛津同义词吧。不要张冠李戴了。
牛津短语动词以前压根没有,后来才加入的。基于谁改进呢?和彩虹版没关系。牛津美语同理。
amob
60
不是标签闭合有问题,不要再以讹传讹了。app显示没问题,数据也没问题。
词典数据是用xhtml标准存储(苹果词典和物书堂都是这个标准),xml标签支持自闭合,html标准只有规定的几个标签支持自闭合。
你到mdx环境中只使用html,浏览器无法判断标签的中止。转换过apple dictionary和物书堂就不会踩这个坑了。
冷知识,只要加上xhtml的标准声明头部就可以在标准的浏览器支持了,但是我尝试了各种词典软件不支持声明,默认你使用的是html而不是xml。
出了删除线的排版问题,纯粹是制作者不懂xml和官方的css,可能压根没买app。
xhtml 声明会让浏览器使用更严格的语法检查,虽然允许自定义标签的自闭合,但不允许闭合缺失的标签出现,出现错误会直接导致页面停止解析,所以词典软件一般不用这个模式。
删除线的问题,直接用 beautifulsoup4 的 html 模式重新解析下生成新的 html 就正常了。
1 个赞
amob
62
最简单的做法就是正则匹配,然后在原来的起始标签后方加一个</{标签名}>就解决了,不用删去末尾的自闭合也没关系,因为浏览器压根不解析,没那么复杂。。。beautifulsoup性能不行。
2 个赞
lgmcw
64
草兄这个动词短语数据跟之前的O9很像,我试试排版看看