World Book Encyclopedia 这本有人制作MDX吗

这部全世界最好、非常适合通读的大百科全书,居然没有人爬取制作MDX。还挺遗憾的
:face_with_open_eyes_and_hand_over_mouth:

2 个赞

有的,包括所有的图片和视频,可惜发现一个不能忍的错误,删了。等我翻翻nas看看有无备份。

2 个赞

请问这个有网页版吗?官网没找到

worldbook官网,需要订阅帐号。

以下这两个mdx都是已经有的:

The World Book Encyclopedia 2006 中文版
The World Book Encyclopedia 2013

是MDX格式的吗

来自楼主: 6.8更新1 World Book Encyclopedia 2013 光盘版 MDX

提取自 World Book Encyclopedia 2013 光盘版 的不完美数据,不完美之处在于,图片只有缩略图,没有大图。

1 个赞

我制作过… 居然都忘了 :joy:

1 个赞

光盘是不是用 IDMSKconv 提取的?不知道我没有记错,后来有人改了一版可以提取大图。不知道有没有人记得。

read_sk.py 这个文件你有保存吗?这个文件被原作者删掉了。

https://telegra.ph/IDM-SK-CD-ROM-读取工具重制---FreeMdict-论坛---Latest-topics-10-27

hua 大在此基础上进行了改版,兼容 Python 3,解决了诸如重复文件名等问题。
最近在解包某光盘的时候发现,superfan 的这个工具并没有读取文件夹信息,例如有两个文件:

  • /path_a/file.txt
  • /path_b/file.txt

解包出来都是 file.txt, 于是便造成了 hua 大发现的重复文件的现象。superfan 的原始代码直接忽略了这个问题,hua 大则是更名文件。

不巧的是,对于这一个光盘却行不通,因为英音和美音发音文件的文件名是一样的,只不过分别放在 us 和 uk 文件夹中。如此一来,如果没有路径信息,就完全混淆在一起了。

经过一番研究,我重写了光盘读取的代码。因为用途不算多,没有做细致的优化,也没有提供命令行接口,有能力的各位可以自行尝试。

不知道你说的文档是啥。如果是指楼上提的光盘的话,如果有更好的光盘提取脚本,就算现在没人想动手,也可以方便以后需要的人。

不是这个,这个版本是 hua 开源的。后面有人在这一版上继续改进了可以提取大图,但是不确定是不是 ubersoft 删除的那个版本。

对这个版本没印象了

确实是经典。

印象中Bill Gates说过他小时候家里有一套,读了不少。

这也是他后来推动微软出版多媒体百科全书Encarta的缘起。Encarta于1993年首次发布,包含了大量文字、图片、音频和视频内容,在2009年停止出版。

研究了半天,应该得买这个订阅
Advanced Annual Subscription | World Book