其他格式 Index of /aarddict
这个下载的速度很快,GD-ng同样支持的格式!
slob格式词库没有中文词库啊,除了一个“萌娘百科”(应该是日本的)。英文的词库数据比zim旧。但是想找小众词库的可以去看看。有一些很冷门的词库。
slob格式词库下载链接见github。
参看此帖。
GD-ng读取slob格式实验:昨天以每秒5M的速度下载了 freeeMdict提供的中文维基百科(20241001版 Index of /aarddict/zhwiki)下载链接,试用一下,查阅词条和文字显示没有任何问题,界面也比较友好。内容与本站邱爷发布的最新版维基百科内容基本一致。不过这个应该是有图版,图片估计与《辞海》在线版mdx一样,需要联网获取,但在国内读不出来,图片处显示为空白,而且鼠标总是一个转动的小圆圈即等待状态。各方面表现比那个23G的zim版要好很多。总之,如果词库充足,slob格式完全可以考虑。
网站上文件大小显示只有3.6g。23g完整有图版减掉图片体积,不会这么小。
这个体积只可能是:
wikipedia_zh_top_maxi_2024-05.zim 2024-05-14 06:07 3.6G
也就是中文版精选版,不是完整的中文维基百科。
zim有解压程式——虽然我在视窗上用不起来。
slob的解压程式,搜了一下,似乎没有?
这个比zim更小众,词库更少,数据也无法解压利用。我个人不感兴趣。
邱爷发布的维基百科完整无图版(20240920)只有2.54G。可见这类大型百科全书,图片和其他信息是占了很大体积的,比文字多很多。我下载的slob版维基百科是完整版,就是图片显示不了,只是一个大大的空白,实在不好看也没有意义了。
我看网站的讨论,slob的设计就是这样。图片需要联网,按需获取。所以slob无所谓有图版、无图版。
有人是写个css隐藏图片的,但是说到了新版,css就失效了。
在article-style里的设置修改全局CSS
/********** Slob dictionaries ***********/
.slobdict_headword {
display: none;
}
.slobdict img.imgtex {
vertical-align: baseline !important;
}
.slobdict img {
display: none !important;
}
.slobdict figcaption {
display: none !important;
}
.slobdict .infobox-caption {
display: none !important;
}
.slobdict .hatnote.navigation-not-searchable {
display: none !important;
}
感谢您的指教!
用 js 给图片链接加上前缀 https://i1.wp.com/ 就能看到图片了。例如:
原图链接:https://upload.wikimedia.org/wikipedia/commons/thumb/d/da/蜀汉丞相忠武侯诸葛亮.jpg/240px-蜀汉丞相忠武侯诸葛亮.jpg
有意思,讨论的人多了,激发出新的知识火花了。
补充:
PyGlossary可以读和写Aard 2 (slob)。
所以懂Python的人是可以把slob的数据抽出来的。
论坛中高人多多!
学习下,资源就不去搞了,太大了,且维基的内容只适合参考,不能用作正经出版文件引用。如果其他类型词典有,可以学习下。我主要工作用这些词典。
维基百科、维基文库的很多内容在其他词典中是根本找不到的,尤其是那些确定不了“学科”所属和现当代内容。就算以专业性而论,很多地方也比普通词典做得更好!而且众所周知,维基的网站在国内是看不了的,所以只能借助于这种线下的方式。
有人比较过英文版《维基百科》和《大英百科》,认为前者的质量可以和后者相比。《维基百科》英文版的质量可能比中文版高。
有些新词只有《维基百科》有,不引《维基百科》,引什么呢?
《百度百科》我就不敢引。
不知道你用什么词典。
slob词库里有一些拉丁文词典和小语种词库。
小语种少,基本就是以汉语为主。坛子里分享的足够用了。
可否帮忙写个js,感谢
Zim 的索引在手机端有问题,Slob 直接没有索引,这些格式推广不开是有原因的。直接用 SQLite 作为词典格式都更靠谱。
英文维基百科质量很高,中文维护的质量一般,中国省以下市区县的资料基本被忽略了,远远不如百度百科全面。
slob相当好用,节省了大量空间,用起来飞快,挂个代理图片也瞬出
中文维基也能挖掘出不少有价值的东西,里面不少信息百度或者英文维基都没收录的。