有人来合作制作维基百科吗

xmg123 · 2023 年6 月 24 日 09:43

下载维基百科的离线数据提取了词头和网址拼接了，三百多万，已经下了二十多万网页了，有人没合作一起下载合作制作吗？图片url和二十多万网页的url链接提取来了，开的魔法下的太慢了

hua · 2023 年6 月 24 日 12:36

维基每过一段时间是有完整数据放出的，你用的是这个吗？

xmg123 · 2023 年6 月 24 日 12:52

slbtty · 2023 年6 月 24 日 13:53

goldendict-ng 支持最新的 ZIM 标准，可以直接用 wikiepdia 的 zim dump，除了 wikipedia 以外，kiwix 还有其它的网站可以用

zimdump.exe dump --dir=/outputdir/ /path_to_file/what.zim

xmg123 · 2023 年6 月 25 日 02:11

这种效果咋样？

anyid · 2023 年7 月 3 日 17:07

请问, 你会不会从zim里面提取数据?

anyid · 2023 年7 月 3 日 17:12

请问, exe 文件是你自己编译的吗?

slbtty · 2023 年7 月 3 日 18:20

windows 在最最下面 zim-tools_win...........zip

不嫌麻烦的话，也可以从 WSL 里 apt install zim-tools。

anyid · 2023 年7 月 4 日 06:28

这个工具, 是从原始数据到 zim 对吧?

slbtty · 2023 年7 月 4 日 06:46

zimdump 是把 zim 解压成原始数据，具体的文档可以看 zimdump.exe --help
zimwriterfs 可以把原始数据打包成 zim （但是这个工具暂时没有移植到 windows 上）

anyid · 2023 年7 月 4 日 15:02

怎么用都不对呢, 烦请, 举个实例呢, 参数怎么设置的

slbtty · 2023 年7 月 4 日 15:06

zimdump dump --dir=what mydict.zim

文档在 zimdump.exe --help 里