Ja Wikipedia.org 20231001 日语维基百科 (离线图像体积76GB)

百度这么慢?估计会员速度快。
等我有了快的uplink会尽量上传到123/蓝辏(?)

离线图像mdd至少20GB-30GB,估计会上传很久很久

2 个赞

离线图片的mdd太大了,估计需要买一个1t内存的手机了!

1 个赞

我一着急,花了9.9元,买了极速下载,8-10m/s。24小时有效。几分钟就下完了。

3 个赞

In the English Wiktionary dump, I have seen a lot of non-alphabet entries. I think we can filter out these entries to reduce the workload…

能否传到123盘或者蓝奏

只有百度网盘,那两个没有用过。

There are English foreign words which are non-ascii and there is no simple ways to filter it out, perhaps just filter by the label in the main text (such as “English” i.e. the language label)

I have filtered by language (which is literally the text in the tab itself) but found the content to be quite sparse and lossy. Many common English words are missing from the original data.

Probably no better way than to wait for the source to address this issue or combine / dedupe previous data and hope the lossiness is random. Or, try to patch the gap with other wiktionary releases. Neither is a non-tedious approach.

1 个赞

恳请大神有时间的情况下出手制作日语版的维基辞典,感觉日中有些词条的解释很有参考价值,感谢!

这张图中的第三个解释好像会用在【息子】上,估计词条编辑者想到了这一点吧^_^

1 个赞

我记得看过日语字典,但是发现内容特别小,只有一个json文件。

你能看看数据是不是可取?

1 个赞

估计是那个54m的文件。词条本身10万左右,应该数据不多哈。

另外,在每天使用您制作的日语维基百科中,有一点儿小小的发现。

下图中的红色线及红色框框所指的地方,一个应该是每一个词条最初的内容,另一个可能是该页面的相关信息。



我想请问一下,【WKT】的位置是否可以通过css调整到标签最开始的地方哈,即第二张图中的【構成】前面。

然后【Me】那个标签是否可以隐藏呢?

这两点其实不调整也完全没有影响的!

再次感谢您制作的精品百科全书!

1 个赞

WKT有些时候是附件,所以我把它放到最后。我不知道用css办法挪动位置。

不过后来的版本修复了这个问题,wkt会一直在前面了。
下次更新会修复这个。日语百科体积还算不太大,重新一次不算太累。

2 个赞

感谢您的回复!百科本地化是学习利器!感谢!

1 个赞

Japanese Wikipedia in .slob format

你好,冒味问下,日文维基的离线图片还会上传吗?
(我看目前法语、中文是有离线图片的,日文的还没看到)

有184万个图片文件,下载好了试着打包上传。估计使用起来需要巨大的内存。

2 个赞

上传了 离线图像,体积76GB

2 个赞

感谢分享!马上去下。

分卷也许可以,不过也确实太大了。

想过这个,分卷还得解压,比较费时。另外对本地要求比较高(两倍体积)
单个mdd改名也轻松一点