维基词典 ZH.wiktionary.org 2025/10/11 数据,离线图像发音,2.5M 词头


MDict_B13aZEqgCv

5 Likes

排版好奇怪



当括号里面不知道是什么,下面的解释也没有。

官网就是这样的

字源里面的html snippet我可以修复,是html嵌入的json转的,无法直接graft 回dom里面。

source data verbatim:

<span
typeof="mw:LanguageVariant"
data-mw-variant='{"disabled":{"t":" style=\"padding: 0.5em; background-color:white; border-top: 1px solid #aaa;border-right: 1px solid #aaa;border: 1px solid #aaa; font-size:x-large\" lang=\"zh-Hant\" class=\"Hant\" | &lt;a rel=\"mw:WikiLink\" href=\"./火#漢語\" title=\"火\" data-parsoid=&apos;{\"stx\":\"piped\",\"a\":{\"href\":\"./火#漢語\"},\"sa\":{\"href\":\"火#漢語\"}}&apos;>&lt;span typeof=\"mw:LanguageVariant\" data-mw-variant=&apos;{\"disabled\":{\"t\":\"火\"}}&apos; data-parsoid=&apos;{\"fl\":[],\"src\":\"-{火}-\"}&apos;>&lt;/span>&lt;/a>"}}'></span>
1 Like

感谢您的解答。

对着这类online信息不断更新的,能不能开发出一种app,(1)联网使用,类似gps导航软件一样。这样,通过app实时获取最新的online词典检索,(2)但增加一个功能,在查询词典后,默认把结果转存到本地,类似离线数据。这样子,就不需要下载这么大的数据,lz发布的资源里面两个mdd是6GB了,(3)而且,这类online资源再不断更新,首选在线使用,可以得到最及时的查询结果。这完全很类似在线地图导航或搜索POI的方式。比如lz发布的,2.5MB的headword,可能一年下来,查询过的不过几百个。

这看侧重哪个了,如果网线拔了,网站被灭了,离线就是一个可控的来源。

如果是on-demand caching(你描绘的use case),那mdict不支持,因为内容mdx mdd都是完全固定的。

可能折中的办法是只更新叠加新的<N.mdd>,mdx定期全部更新,mdx没法叠加N个,而且老的内容还在。

即使这样,你说的那种不就是browser cache 和·proxy agent caching就可以解决的么,任何一个user agent 现在就能办到 (mdict 软件除外)还是得依赖外部infrastructure。

我主要是想备份离线网站。另外以前的,老的内容不一定就是更差。

2 Likes

哦,这么快回复了,多谢交流。我的回复里,仅仅是叙述了一种对online的数据库的使用方法,你的词典也可以看作对online数据库库的一种使用方式了。(2)我的回复,并不是说要在你的词典里面增加这些功能,尤其我说的第2点功能,把查过的词缓存或离线保存到本地。这个用mdx/MDD模式的词典应该很难或几乎做不到吧。可能需要另外开发一个软件了。不过,现在联网使用越来越多,除非特别重要的或紧急的东西,可能越来越倾向于在线使用吧。对于古代汉语的词典,我也曾经下载了很多,后来发现,自己看书时需要查询的话,使用两三个很好的在线查询就足够了,那几个在线网站收录的词典比我本地的还多,而且,有更新和维护。现在,手机里面几乎没有古代汉语的词典了,加上有ai可以问,有时候问ai关于每个汉字,得到的结果和书证比自己查离线或在线词典充分多了。你说的离线使用场景,网线被拔,也有可能吧,除非在不能上网环境,比如有些环境禁止联网,或不能用手机。

我理解你的观点。我就想说,如果网速够快,没有地区或者paywall限制,整个互联网都相当于本地资源。但是那个乌托邦是无法实现的。

我们的本地的资源是从互联网上来的,不可能比互联网还丰富。唯一可能的就像你说的,不能上网,或者互联网部分shutdown。把死掉或者退化的网站(前者McMillan,后者Dictoinary.COM)在活着的时候存档。

互联网和AI不可能永久不退步,新版本100%会悄悄干掉某些好东西,而且是100%不会告诉老百姓的。这点我可以肯定。

字显示不全,右边缺少一部分,在下面又换行显示,感觉好难受。

软件有问题还是词条不一样

我上面的截图事喂鸡词典的。

zh.wiktionary.org是我发的截图

你的八卦截图是喂鸡百科的,不是词典的。


软件问题还是少了啥

可能是软件原因,显示效果大相径庭,我用的是dictango

我用mdict测试了,你看还是只是在左边一点点显示,右边一大块都是空的,影响的区域很大。


右边几个框框内的内容能不能单独排版,

这就是官网的显示,可能并不是针对mobile devices,

官网的就看着挺好。