这部全世界最好、非常适合通读的大百科全书,居然没有人爬取制作MDX。还挺遗憾的
有的,包括所有的图片和视频,可惜发现一个不能忍的错误,删了。等我翻翻nas看看有无备份。
请问这个有网页版吗?官网没找到
worldbook官网,需要订阅帐号。
以下这两个mdx都是已经有的:
The World Book Encyclopedia 2006 中文版
The World Book Encyclopedia 2013
是MDX格式的吗
来自楼主: 6.8更新1 World Book Encyclopedia 2013 光盘版 MDX
提取自 World Book Encyclopedia 2013 光盘版 的不完美数据,不完美之处在于,图片只有缩略图,没有大图。
我制作过… 居然都忘了
光盘是不是用 IDMSKconv 提取的?不知道我没有记错,后来有人改了一版可以提取大图。不知道有没有人记得。
read_sk.py 这个文件你有保存吗?这个文件被原作者删掉了。
https://telegra.ph/IDM-SK-CD-ROM-读取工具重制---FreeMdict-论坛---Latest-topics-10-27
hua 大在此基础上进行了改版,兼容 Python 3,解决了诸如重复文件名等问题。
最近在解包某光盘的时候发现,superfan 的这个工具并没有读取文件夹信息,例如有两个文件:
/path_a/file.txt
/path_b/file.txt
解包出来都是
file.txt
, 于是便造成了 hua 大发现的重复文件的现象。superfan 的原始代码直接忽略了这个问题,hua 大则是更名文件。不巧的是,对于这一个光盘却行不通,因为英音和美音发音文件的文件名是一样的,只不过分别放在 us 和 uk 文件夹中。如此一来,如果没有路径信息,就完全混淆在一起了。
经过一番研究,我重写了光盘读取的代码。因为用途不算多,没有做细致的优化,也没有提供命令行接口,有能力的各位可以自行尝试。
不知道你说的文档是啥。如果是指楼上提的光盘的话,如果有更好的光盘提取脚本,就算现在没人想动手,也可以方便以后需要的人。
不是这个,这个版本是 hua 开源的。后面有人在这一版上继续改进了可以提取大图,但是不确定是不是 ubersoft 删除的那个版本。
对这个版本没印象了
确实是经典。
印象中Bill Gates说过他小时候家里有一套,读了不少。
这也是他后来推动微软出版多媒体百科全书Encarta的缘起。Encarta于1993年首次发布,包含了大量文字、图片、音频和视频内容,在2009年停止出版。
研究了半天,应该得买这个订阅
Advanced Annual Subscription | World Book