剑桥国际的另一个源,仅对比过在线高阶,是比高阶有多有少,感兴趣的可以玩玩。
【图片】NC1020/NC3000/TC1000(s)模拟器,可存档!【文曲星吧】_百度贴吧
我主要是想找找模拟器里还有没有好数据,这个可能是也可能不是,仅供参考。
剑桥国际的另一个源,仅对比过在线高阶,是比高阶有多有少,感兴趣的可以玩玩。
【图片】NC1020/NC3000/TC1000(s)模拟器,可存档!【文曲星吧】_百度贴吧
我主要是想找找模拟器里还有没有好数据,这个可能是也可能不是,仅供参考。
文曲星里面还有《朗文当代英语大辞典双解版》的数据,但是我没找到
这个设备版本可能太新了,没人破解吧。
文曲星大辞典 app 进入的时候宣传页面有朗文、wordnet,但是离线数据只剩这个简单的英汉了。
我觉得应该朗文,是联网才能查的。apk 一共才14M,应该不是内置朗文,看文件夹只有默认的英汉和wordnet两本词典离线数据、还不是明文。
如果当年能离线,也得求助当年下载过的朋友了,又或者有离线版 app 本帖未找到。
3678665446.7z (13.6 MB)
这是文曲星多个型号的文件包,看起来不像是直接能用的软件,更像是开发包,要编译一堆汇编和C代码,我看不懂。
但这单个就能几百兆,想来如果能拿到数据,将有很多资源,不过没有【朗当大】,只有朗3:
我瞅着百度介绍,这俩型号包含的是 AHD 和剑桥 双解。这个 AHD 不会是金山词霸一样的吧
我下载的 nc2600,只有英汉汉英词典(可以正常运行,查单词没问题。
模拟器只能玩玩,提取词典文件,还是要下载 #5 楼 E900 的数据包,里面的 DICTDATA 目录包含 24 本词典的数据。(方便大家研究:
看着是明文,不知道有没有少。剑桥国际的文件名是啥啊?
#5 我全下载了,这个看着不像朗文一样是明文的。
CAMDICT.BIN.zip (8.8 MB)
好像这方法是可以的,只是后面要自动化的话,怎么在内存信息中找到对应数据我不会,应该是记录该软件对磁盘的数据访问的坐标和长度、或者是拦截系统和软件间的通信数据拿到这部分数据。
这样拿内存数据的话,在二进制数据层面要清洗很多非标准字符、替换音标字符之类的。
大家想直接用的话,已经有大体没纰漏的 mdx 了, 英汉双解剑桥国际英语词典 - 英汉 - FreeMdict Forum ,本帖主要是瞅瞅各类源数据及提取方法。