MDX规范对单个词头内容大小的限制?

MdxBuilder貌似对比较大的词头内容有限制?单个词头超过20MB左右的HTML就会被认为太大非法而拒绝压缩工作?
有没有放宽或者无此限制的MDX制作软件?
市面上的词典软件,如GoldenDict,欧路,深蓝,如果遇到比20MB还大的单个词条的MDX,能正常工作吗?
谢谢!

什么词条能超过20M?不会是把多媒体文件嵌入进去了吧。别人设置这个限制是有道理的。MDX是分块压缩,每个块默认是64KB,那么通常一个词条件要远小于64KB才有分块压缩的优势。单个HTML过大应当考虑一下把一些资源文件放到MDD里面去,过大的词条或者过长的词头都会影响性能,可能会卡卡卡…

楼主说的词头是不是那些反查词典的某些词头呢?反查词典的词头普遍较长。除此之外,英语中的谚语、俗语、习语和俚语做成的mdx词典,词头也很长

20M的词条,词典软件加载渲染都费劲吧

这个需求的现实背景是:我在做个小软件将成百上千个自选词汇在不同词典MDX中的解释汇聚在同一个HTML文件中用网页浏览器浏览。
相信肯定有一部分人和我一样有这个“阅读”词典的需求的。
在背记各种词表准备各种英语考试的时候,使用的五花八门的词汇书往往都是词典的一个小子集,只写了最主要的意思一般都不全面的,背完之后想深入了解所背单词的话就需要我这个软件了。
经过测试,WINDOWS下浏览器渲染速度令人惊叹,将牛津朗文柯林斯韦氏四大高阶双解词典加入的话,一个500个单词的HTML在桌面版通用网页浏览器如chrome中渲染往往不到半分钟甚至只需要二十秒不到,过半分钟后就可以随意拉动滚动条无任何卡顿了,甚至一两千单词都都不在话下。现在人们的电脑往往24小时不关机最多也就睡眠状态,一旦唤醒是无需重新渲染的。
桌面WINDOWS下几乎任何浏览器都能正常渲染和在词典软件中看到的效果几乎相同,但遇到的问题是换安卓手机就不行了,手机浏览器往往显示很怪异,不同的手机和不同的安卓版本往往要使用某一个特定的浏览器版本才能很好显示,你可能需要尝试很多浏览器才能找到你手机或者平板合适的浏览器用来看这种HTML。
最后我发现了一个解决方案:用深蓝欧路词典软件来看这些HTML!将500个单词的HTML加上一个自定义的“词头”压缩成MDX让这些词典软件查这个“词头”的时候打开这个巨大HTML压缩成的MDX.令人惊叹的是,不但渲染显示怪异的问题一扫而光,而且小小的过时的手机上安装的词典软件居然一点不比WINDOWS下通用浏览器差,渲染速度甚至反而更快了!!!而且看这500词的时候还可以随时点击其中例句解释中的生词在词典中查,比HTML还方便呢!
唯一的问题是HTML可能超过压缩成MDX的容量限制。当然,可以通过一个HTML不超过20MB左右来不超过限制,即使这样小的HTML也够装一两百个单词五六部甚至十几部词典内容了。现在我是比较贪婪,看看能不能彻底摆脱这个容量限制。

这个软件做出来就会放在这里让大家下载了。

1 个赞

问题是你怎么搜索啊?只能浏览?

1 个赞

半分钟…估计大多数人都没耐心等了。3秒以上的白屏、卡顿都会让人失去兴趣。

dorothyilatorre:“半分钟…估计大多数人都没耐心等了。3秒以上的白屏、卡顿都会让人失去兴趣。”
—— 绝对不是这样的!任何应用都有其特定的场景,不能一刀切一个规范要求。打开10本词典对1个单词的解释要1秒,打开10本词典500个单词要20秒,你就一定要秒杀鄙视这款应用了?非也!

我这个应用是用来浏览阅读精读词典的,不是用来查词的,它和查词的迅捷要求有本质区别。它没有不断的“输入新单词”“打开”“关闭”“切换”这些操作的需求。你所需要做的仅仅是打开一次而已。

假如你某日拿俞敏洪的《GRE词汇精选》初背了200个单词,记住了最核心的中文意思,这时你可能已经花费了两三个小时甚至更长的时间了。然后你想“一词不漏从头到尾”阅读这些词在牛津高阶和朗文当代等著名学习词典中的详细解释。假设你已经有这200个单词的单词列表文件,你首先用我的软件将这个单词列表文件拖进去花大约不到半分钟制作出一个很大HTML,然后用Chrome浏览器打开这个HTML,效果是瞬间就可以看到全屏满满的单词解释了,根本不是你所想的浏览器解析渲染之前先完全是空白。你可以立即用鼠标拖动滚动条,唯一的限制是你在刚打开的三秒钟这么短时间内可能只能滚动比如说十个满屏内容,再往下滚就滚不动了,因为还在解析渲染,那你可以等半分钟甚至一两分钟让它解析渲染完毕。一旦渲染完毕,你就可以永久性地自如滚动缩放文字大小和resize浏览器大小,再无任何卡顿!你也可以用Ctrl-F搜索你想要的单词(我会使用一些小技巧让你仅在词头中搜索而不会跑到其他词头的含这个单词的例句中去)

永远不要对检索提要求,这本来就是用来通读而不是查的。

如果500个单词十部词典一个HTML你感觉渲染太慢,那你可以每个HTML 50个单词做十个HTML啊。之前有人将HTML转成PDF,再我看来是无必要且画蛇添足。HTML中所有内容包括字体都可以通过浏览器缩放,而且浏览器自己窗口大小也可以缩放,和PDF相比,HTML缩放后布局可以变化(如一行的显示的字数可以增减)PDF做死了就没办法。更重要的是,还可以加入JS程序增加各种功能:如只显示指定词典中内容,将单词划分熟悉程度等级只显示自己想要看的等级,隐藏解释只看单词回想释义点击后再显示释义,花样多了去了可以玩好多。这就是在部分完成背单词APP软件的功能。现在市面上背单词的手机APP太多了,但它们都有一个公共的致命的缺陷:它们只为手机小屏幕设计,同时只显示一个单词的解释,要换看其他单词解释你需要切换而且很多时候这种切换比较麻烦要点好几次。我这个软件设计就是为了大平板和台机屏,它可以同时显示满屏巨多的单词解释而不是仅仅一个。通过滚动滚动条查看所有单词解释比那些APP一个个单词不停地点击(好几次)来切换,不知道要舒服多少倍了。我相信世界上总有一部分人和我背单词的学习习惯相同的:到了某个背记阶段,我需要在最短时间内大量迅速地浏览尽可能多的单词和解释,这可能是在总复习,这种总复习如果用那些APP一屏一个单词解释来回不停切换才能看很多单词是要累死的。

我绝不相信一个想深入阅读这200个单词想完整精读词典中所有解释的人,会因为要等半分钟两分钟才能完全渲染完毕就不用它!想想如果没有这个HTML,你一个个单词输入到词典里查,你要花多少冤枉时间?!

你精读这个HTML如果需要花几小时甚至几十小时的时间,你还会在乎最初打开它用了几分钟渲染完毕吗?

Only forget it —— 如果你没有逐词阅读(多部)词典解释的需求。

2 个赞

在这里发一个 朗文当代双解第四版_六级词汇版_2878词.html 大家试看看,不到5MB。在我i5的台机的Chrome中五六秒渲染完毕。想学习的人不会因为这五六秒就拒绝吧?呵呵。
此HTML在我手机浏览器中音标显示乱码(Windows下是好的),试了好久都没办法解决。有办法的朋友请指教。
链接:https://pan.baidu.com/s/1SB3ksVErwoUiS0-ibHReag
提取码:7vxj

1 个赞

好像适合做成 epub,放阅读器里。有目录的话更方便。