那象mdict这种词典软件,怎么去挂新词典呢?mdict怎么知道新挂的mdx的具体结构呢?
mdx 格式总共有三个版本,大多数词典用的是第二版的格式,相同版本的词典结构是一样的。
用 mdict-query 这种模块,是不是不管是啥mdx,都能直接查询呢? 有点糊涂了
多数词典没什么问题。你直接用吧,不行再说。
你只是提取内容的话建议用 2 楼的。
我想在我的软件里加载不同的mdx词典, 有没有啥模块能识别大多数mdx,用同样的代码得到不同mdx的 单词,音标,解释,例句 这些元素呢?(就是不用去关心每个mdx的排版结构,用同样的代码得到以上的基本元素)
没有,mdx 词典的来源很复杂,什么样的 html 结构都有,很多人都尝试了搞不定。
能问出这个问题?你解包过几个就知道了,mdx就是一堆html打包在一起。你这个问题就像我能不能写一份通用代码爬虫世界上所有网站(就是不用去关心每个网页的前端结构,用同样的代码得到需要的基本元素)。