如何设计一个自用的压缩率大的词典格式

不太懂瞎说哈,我估计mdx其实就是把基于html的txt压缩再加个索引,而且mdx本身不带全文搜索的。索引体积相对可以忽略,那么就是从前面做文章了:
(1)txt不基于html,使用固定标签+内容,比如title:xxx;content:xxx;image:xxx(image-caption:xxx);代价是排版和功能不可能像html那样灵活;
(2)压缩算法使用压缩率更高的方案。
不过我觉得再压缩一半不太现实。。