找到问题了,是PDAWIKI那帮人自作聪明瞎搞造成的
henice的那版问么样。差不多37万多词汇?
丢失了3w+的词头
henice的版本cup和CUP都有
你试试yard有吗?还有很多其他问题,我没法去一个一个溯源了。比如大量短语词头逐渐丢失了(不知道是哪个版本开始的)。还有就是原词头中有很多含“或”的词头[类似xxx of (或 about)]这样的词头在某个版本也全部丢失了
yard有,yard下面有一个带“或”的词组,直接把“或”字也输进去查不到,但是已经被拆分成了两个词头,更符合查词实际。
henices 版也缺词头?我就在用这个版本,能列举一些吗?
这个版本没有注明编辑者的名字,不缺cup,CUP,grant, 或yard, 但查不到hahnium和nebulium,能查到coronium。
21.7z.001 (18 MB)
21.7z.002 (8.8 MB)
henices 版都有这些。
确实,都有的。
我这里版本太多了,你把你的版本传上来,我写个程序比较一下
气抖冷!我还觉得这词典的除了老点且不再更新以外,和蓝皮白皮不分上下
太可惜了,最好的数据源只有pleco了,可惜也早下架了没人能提取。有道其实都缺了词源。
henices的数据源应该最好,直接离线文件提取的,不是一条条爬虫来的,但无奈有道太垃圾,这缺那缺。用有道旧客户端我几年前还能下载离线数据,不过因为下架了也不让你查,据说数据是AES加密的,不知道henices时代有没有加密。
另一个源头是qiuhao1112源,明确说明是抓取的:
早了好几年还有个superfan源
不知道现在最广为使用的哈姆九色鹿版是源自哪个,哈姆九色鹿的上一版是十块钱卖的皇帝版。
我以为你前面说的缺 3w+ 词头是指的 henices 版,这版因为是离线数据,除了生僻字,缺少几条例句,应该没什么大问题。
他们喜欢哈姆九色鹿版是因为做了扩词,我觉得是种污染,2333。
主要还是人工校改了很多内容,补了缺词。扩容倒是无所谓。
我现在用的版本好像没有上述问题,分享下
通过网盘分享的文件:21世纪大英汉词典.mdx
链接: 百度网盘 请输入提取码 提取码: 76dv
–来自百度网盘超级会员v5的分享
我觉得,大家也没必要因噎废食,尽管这本词典被删了很多,但是当作词组/短语类的补充手册还是可以的