数据: Index - Wikimedia Enterprise HTML Dumps - 发现数据不完整,有些词头完全没有
下载:百度网盘 请输入提取码
FreeMDict Cloud
2023.10.17
- 本地/远程发音
- 本地/远程图像,图像click to toggle 大小
- 收放部分体积大的list,比如translations
纯英语的版本coming
数据: Index - Wikimedia Enterprise HTML Dumps - 发现数据不完整,有些词头完全没有
下载:百度网盘 请输入提取码
2023.10.17
纯英语的版本coming
只有英语的就很好!
有空弄一个英语only的
厉害!多谢好资源!
不客气,里面很多缺陷,目前就这样了。还有待完善。
嗯,其他语言看不懂也用不着。
试用报告
①mouth和baobab等图加载不上,是否缺少mdd图片包(上次的维基词典的mdd经测试不能使用),还是在线加载有问题?
②查不到wayward。
③有的词条有发音喇叭,但是点击不能发音。
谢谢!
可以把Derived terms和 Translations等内容比较长的栏目默认折叠起来么
有很多词头找不到,我不知道是json里面没有还是我处理html漏掉了,我在研究中。
图像直接链接官网的,你看看copy link address以后能不能浏览器里面试一下?
这可能后续加进去,目前是全部显示
使用wifi,图片不能显示;用手机数据流量图片居然可以显示。遗憾的是,譬如:mouth人头图不像前一版,配有文字说明;点击喇叭也能发音。
这个版本用起来感觉非常不一样,非常棒!再能完善,譬如:缺少的词条(wayward)也都能补全,就更加出色!
谢谢!
好的,有空我会完善,这样以后只要官方格式不变,定期自动更新会比较轻松,不必用scraper
这也太棒了,超级惊喜加感谢,再贪心一点,是否还可以转换中文和日文的百科,对维基的需求就完整了,英文的太大就算了
如果有html dump的数据的话,我可以转换的。英文的里面几百种语言才很大,可以压缩/仅限英语
查了一下,英文百科压缩了的数据是114GB,估计mdx体积也得有10GB,值得一做。
我指的是wikipedia,不是wiktionary,数据我看了也是有的,百科比词典要大不少,如果可以转换其中的中文和日文版,那就超级完美了,pda论坛的百科我用的还是2011版的,那个版本是一个大神修改aard词典的代码转换的,效果最好,但最终来源似乎也还是xml格式的dump
我看到了,114GB 英文百科,中文百科排第六名(大小顺序)
enwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 123204342093 |
---|---|
cebwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 49928241125 |
frwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 44703728806 |
ruwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 34332042508 |
dewiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 33666659818 |
zhwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 31620395208 |
是的,还有ja的,那就静待大神的好消息了
其他的前20名(按体积算), 先做认识的英汉,不识字做起来比较盲目,弄清楚以后再来:)
arwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 29365837272 |
---|---|
jawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 28441098624 |
itwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 27168309907 |
eswiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 24962931161 |
ukwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 23971532326 |
plwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 18543886186 |
svwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 17278672747 |
ptwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 15462660090 |
srwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 14506952168 |
arzwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 13461952297 |
cawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 11685742845 |
nlwiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 11271391316 |
fawiki-NS0-20231001-ENTERPRISE-HTML.json.tar.gz | 10727851042 |
好的好的,不着急
麻烦也把mdd做一下,里面包含图片和音频,当然如果把视频也包含在内就更好了。
谢谢!