Kiwix/zim: 自动爬网站,分科(tex公式)

目前mdict很多科学工程资料中的公式都被转成了图像,而这个保存了原汁原味的tex格式。重新制作或者直接使用效果都特别好。

https://pwa.kiwix.org 可以下载分科数据。

https://youzim.it/ 可以输入网站地址,自动爬数据制作。以后大家不用劳心劳力,直接在这里输入网址即可。

1 Like

这个早有了,可直接下载。wikipedia相关网站都不需要提交。

1 Like

我个人看法直接使用最方便,有网页,全平台应用,扩展,web服务器等。

如果要转制,使用pyglossary可转换成kobo dict source格式。此时词条以"@"标记,可用正则表达式替换成mdict源。有更好办法请推荐。

1 Like

我天,这也太猛了

你这错好像没啥问题,用http:访问或者kiwix应用应该就行了吧。

1 Like

我自己主要用wikipedia数理化生计医分科词典,网页版(pwa.kiwix.org或者浏览器扩展)没问题但pc上不能全自动(android版可改良全自动),目前主用kiwix-serve网页服务器,也没啥问题。应用我嫌弃它太大,也无法全自动就没用。

1 Like

微信读书可以爬嘛(•̀ᴗ•́)و ̑̑

1 Like

直接好家伙 :rofl:

网图说每个汉字都是靠id定位重新排列的,网页里的顺序是错乱的

1 Like

哦吼,这样啊,可惜了 :rofl:

1 Like

kiwix 安卓版不能下载大文件,设置里也没看到导入导出。 :expressionless:

  • 这80G的 wikipedia 文件我总不能放到电脑上吧,太费硬盘了。
  • 那6G的wiktionary 也不能下,放电脑的话都这么费事了,连个网也不费事了。

我上次买了三星的固态,这是我认为比较值的购物
这是不值得的购物

我好讨厌换固态,你是直接让人换吗

这是什么,我眼界小,去的地方少。 :no_mouth:

换内存条、固态是不需要前置技能的。
只要会拧螺丝就行。

女儿吃剩下的东西。
image

我修坏了好几台电脑了,应该是你的手跟我的不一样。

我又双击了一下,原来是手机不能创建>4G的文件,原来我误会 KIWIX 了。

这个手机内部存储就是fat32, 重置就占20G, 这咋改成exfat, 真是处处限制 :roll_eyes:

1 Like

应该是文件系统的原因,手机80g不会有任何问题。你放在外置卡上?卡的系统是fat32? 格式化成ext2或其它系统就不会有任何限制。

2 Likes

一个老手机 :laughing: 格式化了,本来想做个WIKI的离线服务器吧,结果文件系统还不支持 :no_mouth:

好多年没买过SD卡了,罢了罢了

还一个屏幕碎了的,我试试那个去 :laughing:

1 Like

可惜是zim格式,应该没办法直接用网盘做离线服务器。

  1. wiktionary => https://dumps.wikimedia.org/ 这里给出的最大 zim包:7月6.8g;9月6.9G
  2. kiwix => 给出的最大zim包:9月6.46G;10月6.06G

经下载后验证,实为同一个包,因为统计口径单位不同。自带的10月更新一些。

很奇怪的是,这将近7G的 wiktionary 的 zim 包,不带图片、不带发音。

啊,有中文,成语,한국어,Русский,难怪 :tired_face:

但是单独拿来查英语,官方的 zim 包里的英语还缺少好多内容,ONLINE版还有各种穿插介绍,这个版本语言种类全了,单个的英语内容少了许多。还是得专搞一个。缺少文本信息,还缺少发音,图片就更不说了。看来最出名的还是 wikipedia 的数据,总比被墻一点看不到好 :roll_eyes: