En.wiktionary.org mdx 20231001 (10月数据完成)

数据: Index - Wikimedia Enterprise HTML Dumps - 发现数据不完整,有些词头完全没有
下载:百度网盘 请输入提取码

FreeMDict Cloud

FreeMdict Cloud

2023.10.17

  • 本地/远程发音
  • 本地/远程图像,图像click to toggle 大小
  • 收放部分体积大的list,比如translations

纯英语的版本coming

21 个赞

只有英语的就很好!

1 个赞

有空弄一个英语only的

厉害!多谢好资源!

不客气,里面很多缺陷,目前就这样了。还有待完善。

嗯,其他语言看不懂也用不着。

试用报告
①mouth和baobab等图加载不上,是否缺少mdd图片包(上次的维基词典的mdd经测试不能使用),还是在线加载有问题?
②查不到wayward。
③有的词条有发音喇叭,但是点击不能发音。
谢谢!

可以把Derived terms和 Translations等内容比较长的栏目默认折叠起来么

有很多词头找不到,我不知道是json里面没有还是我处理html漏掉了,我在研究中。
图像直接链接官网的,你看看copy link address以后能不能浏览器里面试一下?

这可能后续加进去,目前是全部显示

使用wifi,图片不能显示;用手机数据流量图片居然可以显示。遗憾的是,譬如:mouth人头图不像前一版,配有文字说明;点击喇叭也能发音。
这个版本用起来感觉非常不一样,非常棒!再能完善,譬如:缺少的词条(wayward)也都能补全,就更加出色!
谢谢!

好的,有空我会完善,这样以后只要官方格式不变,定期自动更新会比较轻松,不必用scraper

这也太棒了,超级惊喜加感谢,再贪心一点,是否还可以转换中文和日文的百科:smile:,对维基的需求就完整了,英文的太大就算了

如果有html dump的数据的话,我可以转换的。英文的里面几百种语言才很大,可以压缩/仅限英语

查了一下,英文百科压缩了的数据是114GB,估计mdx体积也得有10GB,值得一做。

我指的是wikipedia,不是wiktionary,数据我看了也是有的,百科比词典要大不少,如果可以转换其中的中文和日文版,那就超级完美了,pda论坛的百科我用的还是2011版的,那个版本是一个大神修改aard词典的代码转换的,效果最好,但最终来源似乎也还是xml格式的dump

我看到了,114GB 英文百科,中文百科排第六名(大小顺序)

enwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 123204342093
cebwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 49928241125
frwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 44703728806
ruwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 34332042508
dewiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 33666659818
zhwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 31620395208

是的,还有ja的,那就静待大神的好消息了:smile:

其他的前20名(按体积算), 先做认识的英汉,不识字做起来比较盲目,弄清楚以后再来:)

arwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 29365837272
jawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 28441098624
itwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 27168309907
eswiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 24962931161
ukwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 23971532326
plwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 18543886186
svwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 17278672747
ptwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 15462660090
srwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 14506952168
arzwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 13461952297
cawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 11685742845
nlwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 11271391316
fawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz 10727851042

好的好的,不着急:smile:

麻烦也把mdd做一下,里面包含图片和音频,当然如果把视频也包含在内就更好了。
谢谢!