写了个简单的mdx 2.0 及mdd 2.0 的reader,用于server,能查对tired

只提取元数据的话,带标识的 XML/HTML 确实可以,最后结果就是类似苹果词典,苹果词典在弹窗的时候,会根据 XPATH 控制显示的内容。

但我想进一步约束义项和例句的关系时就很困难了,比如说很多词典是没有层级关系的,如果我想知道某个例句从属于哪个义项,义项从属于哪个词头就非常困难,需要反复修改源文件,如果只提取 JSON 的话,会相对简单一些,但仍然繁琐。

我之前也有过类似的想法。

除了结构化的优势,JSON 渲染 HTML 还有一个优势就是没有兼容问题,控制力更强类似折叠和显隐,AI 翻译完全不需要词典作者自己来实现,样式也可以使用面板让用户自己修改。

JSON 规范里对象字段是无序语义,确实遇到过需要字段有序的情况,但很少见,真正有顺序需求的场景都会用数组,因为数组的顺序是规范保证的。