在Goldendict-ng中使用zim
需要是学习的动力,困难是锻炼的器材。
我用2019的《维基文库》mdx,很不满意。
但是没有2024的《维基文库》mdx。即便有人做了,大概率也会放在大陆网盘,我也下载不了。
但是《维基百科》、《维基文库》等都有zim格式的,可以下载。而Goldendict-ng可以打开zim。
不如去下载一个2024的zim版《维基文库》来用?
在此下载zim文件
wikisource_zh_all_maxi_2024-03.zim 11-Mar-2024 13:59 13124749441
wikisource_zh_all_nopic_2024-03.zim 11-Mar-2024 05:53 12115652978
zh 代表中文,nopic无图,maxi有图。
选了无图的wikisource_zh_all_nopic_2024-03.zim,11.2g,允许加速,清晨下载,大约半小时下载完。
在Goldendict-ng的content文件里再开一个文件夹,把文件放进去。
和别的mdx可以通检。
不试不知道,试了才知道:有何难哉?
《维基百科》可以如法炮制。
能翻墙的大陆书友找个最新的zim来用就是。不必等人做mdx。
下一步准备学习解压zim来利用其中的数据。
用Zimdump解压zim。
Zimdump
解压大概也不会困难。
不过,假如要把解压后的文件抽出需要的部分,做成mdx,大概需要克难前进。
那才是真正辅助锻炼的器材。
3-10-2024
推荐用kiwix下载站,速度比较快。其中的《维基百科》还有内容分类版。维基原站没有这种内容分类版。
5 个赞
太棒了!用 free download 可以下载!速度2M左右,正在下载中。shaoshi先生提供的信息和方法才是真正的慷慨惠人。
有人说大陆下载不了维基网站的东西。(不过aimdict好像能下载?)
嗯,《易经》曰:穷则变,变则通。
不能变通吗?
kiwix是可以看zim的浏览器。kiwix网站也提供zim的。当然,我用Goldendict-ng看zim,不必再去找另一个浏览器。
zim文件下载
维基文库zim下载
嗯,最新文件日期和《维基百科》的官网下载一样。
我用“站长工具” 测试了一下kiwix的下载站。
在大陆可以用啊。
是登录不了维基的网站,但根据先生提供的地址,可以通过复制链接,用 free download manager下载,而且速度很不错。最高速度达到4.0m/s.
另外,要大赞Goldendict-ng ,功能强大,运行稳定,兼容性好!
@xiaoyifang
给xiaoyifang点赞。 真是太厉害了,连zim也能看。
这样一来,就多出了很多经常更新的词库可用:《维基百科》、《维基文库》、《维基词典》等等,中英文词库都有啊。Kiwi网站上还有一些杂类的zim。不知道有哪些zim,得研究。
关键在于:Goldendict-ng能用,可以和别的mdx词典通检。合在一起用,和分开来用,威力是不一样的。所以我不会去用Kiwi看zim,肯定会用Goldendict-ng看zim。
已导入成功,真好!谢谢shaoshi兄!正在下载有图版了。
有了一些大类的目录。不过发现GD-ng的繁简通搜对zim可能不起作用,要用繁体才能搜到。
四库全书打开后是竖排的,也很好!
1 个赞
在textpro里打简体字,再转换为繁体字,复制粘贴检索。
多两个步骤。也不麻烦。
Emeditor也可以做简繁转换的,不过需要另外装插件。
zim词库随见录
Index of /zim/gutenberg
古登堡电子书。
gutenberg_zh_all_2023-08.zim 2024-03-08 11:18 322M
http://download.kiwix.org/zim/gutenberg/
这应该是讨论英文的论坛帖子?
english.stackexchange.com_mul_all_2024-10.zim 2024-10-31 23:23 686M
http://download.kiwix.org/zim/stack_exchange/
1 个赞
四部丛刊三编也基本齐全了,太好了。
四库、古今图书集成等中发现一些缺字,估计有图版能补足吧?有图版仅比无图版多一个G,尚未下载完。
假如想《维基百科》的文史部分抽出来做文史版,那就可以做。因为我不是对《维基百科》中的所有内容都感兴趣。政治的部分我不感兴趣。
假如想抽出《维基文库》中的特定书,如《全唐文》,也得自己动手。
抽出来单行,不会太大,也能更改加校记。
zim是可以解压,但是没有视窗上的打包工具。一改就无法打包回去,和mdx不一样。
像《维基词典》,内容完全可用,当然不必动手。
当然,是否需要抽出来,真没有迫切的需要。
没有迫切的需要,可能就懒得动手了。
因为这些文件是一直在更新的。源文件一更新,那么mdx改不改呢?换了新的mdx,旧的mdx上的校记怎么办呢?
考虑多了,可能就懒得动手了。
有图版补足了缺字。四库全书、四部丛刊等都是每个页面一卷,左右滑动翻页,这种设计方便!
1 个赞
感谢告知。只好再去下载一个有图版。
我的印象是《维基文库》没用图像字。看来不同的编辑者风格不同,有的爱用图像字。
史记三家注本制作精良,以不同颜色字体区分内容,结构很清晰。这样的电子版比纸质书更让人爱读!又试了一下,Gd-ng的繁简通搜以及页面内部的繁简转换是起作用的!
字典工具词库格式支持的多,对应的选择也多。建议真较真的话,善用全文检索。速度基本上秒杀。
给自己简单科普一下:
.zim格式介绍
定义与用途
.zim文件是一种开放的档案格式,专为离线存储Wiki内容而设计,尤其是维基百科及其相关项目。该格式允许将网站内容以紧凑的方式存储,适合在USB等移动存储设备上使用。其名称来源于“Zeno IMproved”,是对早期Zeno文件格式的改进。
技术特点
压缩与存储:ZIM文件使用LZMA2压缩算法,使得存储内容更加紧凑。与原始的Wikipedia XML数据库下载相比,ZIM文件能够更有效地索引和管理内容,包括全文搜索索引和本地分类。
文件结构:每个ZIM文件以一个位于偏移量0的头部开始,所有数据均采用小端格式存储,整数类型为无符号整数(如uint_16、uint_32、uint_64)。
兼容性:ZIM格式并不向后兼容于早期的Zeno格式,开发者可以通过openZIM项目获取格式规范和开源实现(如LibZim)。
应用程序
ZIM文件可以通过多种应用程序打开和阅读,最著名的包括Kiwix和ZIMReader。这些工具使用户能够在没有互联网连接的情况下访问和浏览存储在ZIM文件中的内容。
总结
总的来说,.zim格式是一种高效的离线存储解决方案,特别适合需要访问大量Wiki内容的用户。它的设计旨在提供快速的访问和良好的存储效率,使得用户能够在各种设备上轻松获取信息。
说实话,人家已经发布了很多年,以前却完全不知道,更别说使用了。这大概就是“缘”吧?
1 个赞