使用mdict-utils遇到的一个问题

我用mdict-utils时碰到了错误,请问有群友遇到过吗?

命令:mdict-utils.exe -x “G:\Mdict\test.mdx” --exdb -d “G:\Mdict\Temp”

错误信息: utf-16-le’ codec can’t decode byte 0x30 in position 2: truncated data

找到原因了
image

遇到过,请教是怎么解决的?

所有文件都使用 UTF8。

1 个赞

对的,这其实也暴露出这个工具的一个缺点,不能提取编码是UTF16的mdx内容

问题是怎么修改mdx的编码?
比如之前用utils提取陆谷孙英汉大的词头,提取到AAAS卡住报错,也是编码问题,因为下一个词头是AAA²。

只能用MdxExport了

明明没写可以解包1.2版本的mdx,结果部分可以,部分不可以。(源文本都是UTF-8 NO BOM,非Compact HTML) 不知道具体原因。