FF版 LDOCE 5++ 数据来源问题

最近解包查看FF这本词典里的数据,尝试提取JSON数据,总是有漏掉的文本,发现文本的数据结构被修改过,想问下这本词典的原始数据来源是哪里?记忆里双解的文本来自12年的双解光盘版的提取,但也有贴子说是某个APP中提取的数据?没找到可以下载的ISO文件,有没有朋友还记得FF LDOCE 5++ v2.15 版本的数据来源?

有道+官网吧,有道的数据质量肯定难尽如人意。双解版光盘只有图片,不可能提取自这里,单独的根据这个做的切词版mdx也有。

1 个赞

12年的光盘就开始用图片了吗?还有没有别人做过有道版的mdx? 想对比下数据。

我也很想要有道原版数据,目前来看,找不到。我记得有人展示过,没有人公开分享过。

1 个赞

以前的说明

v1.35大约是一年多前发的吧,长期没更新,应该没啥bug,改版资源多。
v2.00是新版,优化了函数,重整了样式,性能似乎好很多(v1.35版在手机上可能会很卡,所以有各种“秒开”改版,v2.00个人使用非常流畅)。比较大的功能更新包括:(1) word family加强,从chambers dictionary里提取,比朗文自带的要全;(2) 中文topic功能正式开放,之前的中文很多事机翻的所以默认不开启;(3) 同音词;(4) 语料库彩蛋比前版更细;(5) 一个隐藏功能。
v2.15是v2.00的bug修复版。

1 个赞

FF这版主要问题是词条的HTML结构修改后不一致,无法提取完整数据了。LDOCE5 光盘我只看到英文版的,双解的光盘版没见过,有道的MDX也没见过,不确定还有没有其他MDX包含双解版的原始数据。

有道19年就下架朗文了,不知道哪里还有 LDOCE5 双解的原始数据。