[2024/9/28]中文维基百科20240920文字版For Mdict

2024/09/28:

Hi,首先祝大家国庆快乐。
中文维基百科20240920文字版For Mdict发布了。内容:2694319词条+136269公式图片。大小:mdx:2.55 G,mdd:71.44 M。


制作信息:
·数据:Index of /zhwiki/
·工具:i-wiki 0.76 & Mdxbulider 3.0
·鸣谢:特别鸣谢Rayman Zhang(提供MDict平台)、i-wiki(提供喂鸡转换引擎)、imfirefly(提供正则表达式帮助)。
·说明:
*基于20240920版本离线数据制作。绝大多数词条(>99.9%)均采用i-wiki 0.76引擎转制,保证总体效果;极少数冗长异常的词条(<100个)采用wikicafe引擎转制,兼顾内容完整。
*优化:删除若干个空白词条;对百万个简繁同名、异名同义词条进行重定向、内链跳转。

下载地址:

#(百度网盘,访问码:g52v)百度网盘 请输入提取码
#(天翼云盘,访问码:hfp8)https://cloud.189.cn/t/y6jeAv6JRRZr
#(文叔叔,访问码:无,有效期7天)文叔叔 - 传文件,找文叔叔(永不限速)

输出日志:

Begining loading source file... Done  Time used for this section: 105 seconds 
Sorting dictionary... Done! 
Begin processing index... Done! 
Original index size = 67738KB, compressed size = 26266KB, compression ratio = 38% Time used for this section: 27 seconds 
Begin processing data contents... Done! 
Original text size = 9518379KB, compressed size = 2641381KB, compression ratio = 27% Time used for this section: 789 seconds 
Number of entries: 2694319 
Begining scaning data directory ... Done 
Begin processing  data file index... Done! 
Original index size = 11976KB, compressed size = 3814KB, compression ratio = 31% 
Begin processing data file contents... Done! 
Original text size = 79959KB, compressed size = 69309KB, compression ratio = 86% 
Number of entries: 136269 Conversion succeed! 
24 个赞

感谢大佬,强烈顶 :grinning: :grinning: :grinning: :grinning: :grinning: :grinning:

1 个赞

没注意 ,原来是邱前辈 :+1: :+1: :+1: :+1: :+1: :+1:

1 个赞

感谢楼主分享新版

制作完美!百科全书类词典,有此一部足矣!此贴应该列入精品主题。

欢迎邱前辈,欢迎欢迎

感谢分享,我用的还是几年前版本,可以考虑更新一下了。

回报个bug——
查【梅山七怪】,有词条但无法正确显示内容。
查看原网站,应该是要跳转到“封神演義角色列表#梅山七怪”。
猜测可能是mdx的重定向不支持#导致的。

重逢大佬,可喜可贺!!!

请问“中文维基百科”网站能访问的网址是什么?我有好些年没有登录上去了

已用了多年,非常方便,省却爬墙的麻烦。感谢邱大佬的不懈更新分享,非常期待能有年底的图片版。

感谢楼主分享

下载完成。感恩分享 :slightly_smiling_face:

娘啊,几次要回帖网络就呵呵我,终于可以了,好词典,楼主国庆快乐。

追了十多年了吧,感谢邱前辈锲而不舍的努力,有条件的 支持一下。

哪位大哥可以把文件上传到坛里吗?百度盘真的很慢很慢,谢谢

部分条目无法解析,直接使用浏览器打开同样报错,是使用的格式不受支持的原因吗?电脑配置不行,编辑文件会卡死

推荐试试这个
freeeMdict

31

8 天

其他格式 Index of /aarddict

邱老师,我发现这一版很多很多词条的内容丢失不全,同一个词条24版和23版,22版内容量差较多,表现为丢段落。不知道是编译过程中程序舍掉了还是内容被编撰者删掉了。还有就是每个词条的表格能不能像22版以前那样就小小的放在右边,和网站布局一致。从23版开始表头横跨满页面不好阅读。如果您看到我的留言,能不能考虑下一版更新时采纳。

虽然我平时有能力访问Wikipedia,但还是要谢谢你这么努力!

1 个赞