那位大神会把 PDF 词典做成 Mdx 文件! 求大师指点迷津

那位大神会把 PDF 词典做成 Mdx 文件! 求大师指点迷津. 最近本人急需一本好的土木工程英汉词典. 想自己做一个 Mdx. 请大神指点迷津. 谢谢

挺麻烦,挺耗时间的,对于高手来说,可能用的是时间少点,因为他们可以自己写转格式的软件。对于大多数不会写软件的普通人来说,PDF词典制作成mdx文件首先需要先把PDF转成txt (或者html因为有人有html转mdx的软件),没有这软件的人基本都是pdf先转成txt,然后一个词条一个词条的进行处理(就像写html代码一样),当然如果你转格式转出来还有进行词条校对排版,才能处理那些词条,词条处理过程中经常会用到正则表达式,这可以节约处理的时间,如果你不会用正则表达式,那工作量非常恐怖,然后还有一个软件EmEditor最好会用,因为这个软件能打开和编辑非常大的txt文件,而且支持正则表达式。
需要的软件:GetDict.exe 这个软件是把别人的mdx词典解包的软件,可以解出原始文件,如果你开始不会编辑,可以先找个简单的没有css的mdx词典用这个软件解开,看看人家代码如何写的。刚开始的时候别去找带css样式的mdx词典解包,因为里面的代码写的很复杂,看完会疯掉。
GetDict.exe 这个软件我用的是2.6版的,慢慢是能找到下载的。
然后就是制作mdx词典需要的核心软件mdx Builder 3.0 beta2 (我个人使用的版本)如果你在GoldendDict软件上使用,那么就用这个版本,别用高版本的,高版本的制作出来的mdx文件在GoldenDict上打不开。

再强调一下,制作mdx词典正则表达式基本上是必备知识,如果你会这个,那么制作mdx词典很容易。如果你不会这个,建议先学会。给你发个正则表达式教程英文的,是lynda.com制作的,讲的很不错,这是目前能找到的正则表达式比较好的视频教程了,需要英文听力水平到位才能听懂,不过那人并没使用多么复杂的英语进行讲解。链接:https://pan.baidu.com/s/1_twrqE1dtE-dvLtjf53gDg
提取码:w3yv
提示一下:正则表达式里面采用的符号与对应的英语单词有关,还有些符号是采用高中数学里的一些东西,如果知道这个,记忆起来比较简单,如果不知道,死记硬背会非常痛苦。学会正则表达式到自己会自由的使用是两回事,正则表达式要不断的使用,不断思考,不断的找原因,这样才能学好。再推荐一个分解正则表达式的软件,就是如何理解别人写的那种非常长的正则表达式每部分是干什么用的,这个软件名是Expresso,自己搜索下载。这个软件注册免费的。建议刚开始自己写正则表达式学着添加注释,否则自己写的表达式非常长会忘了具体哪部分是干什么的,等出错的时候你自己检查错误会非常痛苦。跟看二进制代码差不多,比那强点。正则表达式教程刚开始的时候强烈建议看英文版的,这点不是骗人,因为我刚开始的时候是看中文版的,看了很长时间没多少收获,没理解多点,后来看了lynda.com的那个英文视频系列才看懂到底怎么回事。为什么当初先看中文的没看懂?因为里面的中文表述造成里面不少东西不好理解。聪明人可能几个小时就能看明白怎么回事,一般人可能需要几天时间,因为那个正则表达式英文视频里面有很多集,完整看完需要一定时间,而只看一遍,有些地方并不能理解到位,我个人不止看了一天。

学好正则表达式需要心理因素是你需要有几分钟就能解决别人几个月的那种排版工作量才行,然后思考如何写表达式。没有这种想法不能促进思考。

正则表达式的长处主要用在查找和替换上,它可以把上百兆甚至更大的txt词典文件里面的全部句子瞬间提取出来,前提是你写的表达式准确而且强悍,当然因为txt词典文件数据里的一些错误造成提取的一些错误。如果按照最笨的办法不使用正则表达式把上百兆txt词典里的几十万英文和中文对照的句子全部提取出来,那肯定不知道多少个月才能完成。但是用正则表达式,几分钟就弄出来了。

下面是别人制作的一个如何制作mdx词典的视频教程,包括制作mdd。
链接:百度网盘-链接不存在
提取码:kj9x

8 Likes

GetDict2_6.zip (45.0 KB)
MdxBuilder3.0.rar (1.3 MB)

了解了就不复杂,推荐:GitHub - VimWei/MdxSourceBuilder: 一键制作mdx图片词典

2 Likes

站内有[英-汉] ◆土木工程词典【dfxk01原创】【版本日期20081124】.mdx (138.2 KB),如果你的跟这本格式相同(英汉对照)。可以将pdf转成相应txt格式再转mdx。