聊一聊制作mdx词典时那些容易踩到的坑

希望群策群力集中讨论一下,方便新人少走弯路
先抛个砖:

在Windows上,无法创建名为con或者aux的文件夹或者文件,这个问题来源于Windows上的限制。如果最初在抓取数据的时候不知道Windows有这个限制,所以也没有考虑到这个问题,就会导致几百个单词的发音文件路径失效,需要回头返工修复。

2 发音文件 文件名里不要包含 - 字符,软件(起码goldendict)识别不了

补充一个用MdxBuilder制作mdd的坑:
MdxBuilder大文件特别版用的挺顺手,但不能制作数据文件(.mdd)。后来才知道,制作数据文件(.mdd)要用标准版本。如仅进行数据文件(.mdd)制作,标准版本勾选Build Data archive only后就不用填写Source路径等字段。

但需要处理超大量数据制作mdx的时候,MdxBuilder标准版本会出现内存不足的现象。MdxBuilder 3.0 beta1 大文件特别版这个版本进行了一些特殊处理,减少了内存消耗,但只能支持MDict(Html)/MDict(Compact HTML)模式打包mdx。

4.css文件名不要有空格,起名注意区分,虽然欧路可同名识别,但是打包进mdd,有空格就识别不了;
5.使用特殊符号命名,比如®,Export时会提示打开错误;
6.使用MdxExport时,不要在词典信息处按换行;
7.词典名留空,方便大家改成自己喜欢的。

我做的 教育部 异体字 是用官方打包的,目前没遇到官方的打不出来的问题。21.2G

欧路可自定义 另外我建议这个需要设置

21.2G是mdd吧,制作mdd也只能用标准版。如果是制作大型mdx,很容易碰上内存问题,往往需要大文件版,而其对应mdd则另外用标准版打包。

比如 the little dic,真的大

据说GetDict 2.6 转出style常有机会出现乱码
(有style.txt要用Compact HTML格式打包)
这时候改用GetDict 2.3 即可
但GetDict2.3不能解mdd

所以, 结论是:
要解mdd, 请用GetDict 2.6
要解mdx, 请用GetDict 2.3

看来MdxExport3.5也不错
https://www.pdawiki.com/forum/thread-17709-1-1.html

还有个说法:反編譯mdd最好還是用xwang-mdict-analysis這個工具,從不會亂,原先是什麼樣子,轉出來還是什麼樣子。
要去最新的commit下载

Mdx在各种词典软件上的适配是个烦人的事情,琐碎鸡毛蒜皮但不得不注意。以欧陆为例:

  • 欧陆词典不支持tif图片格式。图片型词典在优化后只能保存为体积稍大的png格式。有些词典背景透明图片在欧路夜间模式下看不了,而白色背景下正常。
  • 欧陆词典无法直接设置发音库。
    看来欧陆还有很多地方需要改进啊

应该是可以的吧。。。你骗我没用过欧路

能的吧,还支持同名呢

已删。看到的这个说法,原来不靠谱。
话说我还是ios版欧陆正版用户,但没怎么用,还没把电脑上的词典考进去。@Arlin