中文维基 zh.wikipedia.org 20231001 (9月离线123GB照片+10月mdx)

嗯嗯 是的,隔壁的没有图像,而且地名词条的行政区划内容也缺漏,没您的完整

说不定以后html dumps会完善一些。zim我记得字典版本里面居然也没有真实例句。图像和例句删了也是醉了。

1 个赞

图像和语音数据弄完了,大约230GB。.这得压缩一整天,上传一个礼拜吧。。。

2 个赞

你在什么位置,上传百度网盘没那么慢吧。

这么大,指的是,所有危机产品?
谢谢您的付出!

仅仅是中文维基百科的,09月1号的内容。

1 个赞

要是英文版的那会更大

还没敢下载英文百科的离线media,估计500GB以上。

中文百科大概有1.76M个文件。

刚发现中文百科的media 已经385GB了,估计超过500GB(没想到webm和video的体积)

这次m老师制作的全版危机百科mdx(算得上多媒体了)堪称鸿篇巨制——前无古人,就我们这个圈子,当然也可以放眼全球,尤其是英文版和汉语版更是令人青睐!

非常感谢!

1 个赞

过奖了,都是因为有了html dumps才能折腾出来mdx。

对了,遇到过这样情况:就是如果不是百度网盘“高端用户——付费用户”,免费用户最大上传4G(一般设置成3.9G,因为设置4G实际上超过百度网盘免费用户上限)。有一次转存词典5G的文件(如同这次转存危机百科12G一样),容许转存超过4G文件(但是如上面说的,免费用户不许直接上传超过4G的文件),过了一段时间,这个5G文件在不警告的情况下,被百度网盘删除——十分可惜!

麻烦m老师把mdx和mdd能做成3.9G的文件上传(即便是若干个3.9G的压缩分包也可以,有前辈这样做过,本人存储至今)。这样m老师会很麻烦、很辛苦!
以上仅供参考!
多谢!

下载没有限制,所以你可以在上传之前把大文件 压缩成4GB的序列 (把压缩关闭只是切割)

是的,但是存储就会有限制(如#52所述,遇到过——百度网盘不警告就删除)

你可以下载以后打包3.9或者1GB的zip rar之类的,不用压缩了。
然后上传。
我上传太慢了。

本人转存你的危机百科,不会后面下载之后,再存储在百度网盘上。问题就在这里

转存不知道里面的要求,对于百度来说,转存不耗费空间,就是一个链接。
我主要是没法轻松的上传。

算作转存者的空间使用(个人百度网盘存储空间会减除,只是百度网盘应该只认一个源文件,后面人存储就算个人空间,但是百度没有再消耗空间)。这到不是个问题,问题是非付费用户转存超过4G的文件,百度会删除

明白了。听说有可以在百度云里面压缩打包大文件的API,我不太清楚是不是可行。这样就不必下载,打包,上传的过程了。反正这些文件不会真的丢了,只要维持一个分享链接。

碎片的mdx应该不好。

前面所说的仅供参考!
老师是高人,英文又很厉害!
谢谢!

另外,中文又更新了,后面还应该有mdx文件吧?也就是说,完整版还要等待?