在Goldendict-ng中使用zim和slob

在Goldendict-ng中使用zim

需要是学习的动力,困难是锻炼的器材。

我用2019的《维基文库》mdx,很不满意。

但是没有2024的《维基文库》mdx。即便有人做了,大概率也会放在大陆网盘,我也下载不了。

但是《维基百科》、《维基文库》等都有zim格式的,可以下载。而Goldendict-ng可以打开zim。

不如去下载一个2024的zim版《维基文库》来用?

在此下载zim文件

wikisource_zh_all_maxi_2024-03.zim 11-Mar-2024 13:59 13124749441
wikisource_zh_all_nopic_2024-03.zim 11-Mar-2024 05:53 12115652978
zh 代表中文,nopic无图,maxi有图。

选了无图的wikisource_zh_all_nopic_2024-03.zim,11.2g,允许加速,清晨下载,大约半小时下载完。

在Goldendict-ng的content文件里再开一个文件夹,把文件放进去。

和别的mdx可以通检。

不试不知道,试了才知道:有何难哉?

《维基百科》可以如法炮制。

能翻墙的大陆书友找个最新的zim来用就是。不必等人做mdx。

下一步准备学习解压zim来利用其中的数据。

用Zimdump解压zim。

Zimdump

解压大概也不会困难。

不过,假如要把解压后的文件抽出需要的部分,做成mdx,大概需要克难前进。

那才是真正辅助锻炼的器材。

3-10-2024

推荐用kiwix下载站,速度比较快。其中的《维基百科》还有内容分类版。维基原站没有这种内容分类版。

5 个赞

太棒了!用 free download 可以下载!速度2M左右,正在下载中。shaoshi先生提供的信息和方法才是真正的慷慨惠人。

有人说大陆下载不了维基网站的东西。(不过aimdict好像能下载?)

嗯,《易经》曰:穷则变,变则通。

不能变通吗?

kiwix是可以看zim的浏览器。kiwix网站也提供zim的。当然,我用Goldendict-ng看zim,不必再去找另一个浏览器。

zim文件下载

维基文库zim下载

嗯,最新文件日期和《维基百科》的官网下载一样。

我用“站长工具” 测试了一下kiwix的下载站。

在大陆可以用啊。

是登录不了维基的网站,但根据先生提供的地址,可以通过复制链接,用 free download manager下载,而且速度很不错。最高速度达到4.0m/s.

另外,要大赞Goldendict-ng ,功能强大,运行稳定,兼容性好!

@xiaoyifang
给xiaoyifang点赞。 :heart:真是太厉害了,连zim也能看。 :heavy_heart_exclamation: :joy:

这样一来,就多出了很多经常更新的词库可用:《维基百科》、《维基文库》、《维基词典》等等,中英文词库都有啊。Kiwi网站上还有一些杂类的zim。不知道有哪些zim,得研究。

关键在于:Goldendict-ng能用,可以和别的mdx词典通检。合在一起用,和分开来用,威力是不一样的。所以我不会去用Kiwi看zim,肯定会用Goldendict-ng看zim。



已导入成功,真好!谢谢shaoshi兄!正在下载有图版了。 :smiley:


有了一些大类的目录。不过发现GD-ng的繁简通搜对zim可能不起作用,要用繁体才能搜到。

四库全书打开后是竖排的,也很好!

1 个赞

在textpro里打简体字,再转换为繁体字,复制粘贴检索。

多两个步骤。也不麻烦。

Emeditor也可以做简繁转换的,不过需要另外装插件。

zim词库随见录

Index of /zim/gutenberg
古登堡电子书。
gutenberg_zh_all_2023-08.zim 2024-03-08 11:18 322M
http://download.kiwix.org/zim/gutenberg/

这应该是讨论英文的论坛帖子?
english.stackexchange.com_mul_all_2024-10.zim 2024-10-31 23:23 686M
http://download.kiwix.org/zim/stack_exchange/

1 个赞

四部丛刊三编也基本齐全了,太好了。


四库、古今图书集成等中发现一些缺字,估计有图版能补足吧?有图版仅比无图版多一个G,尚未下载完。

zim格式很好,没有必要再转换为mdx了吧。

假如想《维基百科》的文史部分抽出来做文史版,那就可以做。因为我不是对《维基百科》中的所有内容都感兴趣。政治的部分我不感兴趣。

假如想抽出《维基文库》中的特定书,如《全唐文》,也得自己动手。

抽出来单行,不会太大,也能更改加校记。

zim是可以解压,但是没有视窗上的打包工具。一改就无法打包回去,和mdx不一样。

像《维基词典》,内容完全可用,当然不必动手。

当然,是否需要抽出来,真没有迫切的需要。

没有迫切的需要,可能就懒得动手了。 :grinning:

因为这些文件是一直在更新的。源文件一更新,那么mdx改不改呢?换了新的mdx,旧的mdx上的校记怎么办呢?

考虑多了,可能就懒得动手了。 :grinning:


有图版补足了缺字。四库全书、四部丛刊等都是每个页面一卷,左右滑动翻页,这种设计方便!

1 个赞

感谢告知。只好再去下载一个有图版。 :grinning:

我的印象是《维基文库》没用图像字。看来不同的编辑者风格不同,有的爱用图像字。

史记三家注本制作精良,以不同颜色字体区分内容,结构很清晰。这样的电子版比纸质书更让人爱读!又试了一下,Gd-ng的繁简通搜以及页面内部的繁简转换是起作用的!


修正了。 :heavy_heart_exclamation:

过了几年,理应有人发现和修正的。

字典工具词库格式支持的多,对应的选择也多。建议真较真的话,善用全文检索。速度基本上秒杀。

给自己简单科普一下:
.zim格式介绍
定义与用途
.zim文件是一种开放的档案格式,专为离线存储Wiki内容而设计,尤其是维基百科及其相关项目。该格式允许将网站内容以紧凑的方式存储,适合在USB等移动存储设备上使用。其名称来源于“Zeno IMproved”,是对早期Zeno文件格式的改进。
技术特点
压缩与存储:ZIM文件使用LZMA2压缩算法,使得存储内容更加紧凑。与原始的Wikipedia XML数据库下载相比,ZIM文件能够更有效地索引和管理内容,包括全文搜索索引和本地分类。
文件结构:每个ZIM文件以一个位于偏移量0的头部开始,所有数据均采用小端格式存储,整数类型为无符号整数(如uint_16、uint_32、uint_64)。
兼容性:ZIM格式并不向后兼容于早期的Zeno格式,开发者可以通过openZIM项目获取格式规范和开源实现(如LibZim)。
应用程序
ZIM文件可以通过多种应用程序打开和阅读,最著名的包括Kiwix和ZIMReader。这些工具使用户能够在没有互联网连接的情况下访问和浏览存储在ZIM文件中的内容。
总结
总的来说,.zim格式是一种高效的离线存储解决方案,特别适合需要访问大量Wiki内容的用户。它的设计旨在提供快速的访问和良好的存储效率,使得用户能够在各种设备上轻松获取信息。

说实话,人家已经发布了很多年,以前却完全不知道,更别说使用了。这大概就是“缘”吧?

1 个赞