请教词典排版的思路

我最近在给一个词典排版,遇到了一些问题,想和大家探讨一下,目的是寻求最佳解决方法。
我的操作过程是这样的,拿到一个mdx、mdd文件,解压mdx得到txt文件,然后在其中随便找一个词条,开始排版,然后再找几个词条参考词条的格式,就这样一直修改下去。问题是一个词典都有数万个词条,可能有几十上百中词条结构,我抽查的词条可能也就几十个,能抽查上百个都算挺多的了,完全有可能我抽查的这些词条的结构并不包括词典中所有词条的结构,那也就意味着我的排版不完全,肯定有一些词条是我的排版没有覆盖的。
我想请问大家,你们是怎样找到所有词条的结构的?就是一个一个手工的抽查吗?比如那我这一次排版来说,我抽查了几十个词以后才发现有"Summary"这种总结单词用法的部分,于是赶快排版。结果又抽查了几十个又发现原来词条的每个义项下某种情况下还能能子义项,等等就是这样的问题。

凭借经验抽最多义项的几个词来排版。比如:apple take go

除非你是制作那本词典的人,你很难兼顾所有标签呢。没有排到的再排就行了,一口气整完,整好不现实。

也可以排好一版之后,用 mdict 打开,按↓键浏览抽查,这个也很快,你不用浏览全部,跳着看。

嗯嗯,也只能这样了,不过我想到了一个更好的办法。那就是我写一个软件,随机读取词典txt文件中的一个词条,然后写到HTML文件里,而HTML用live preview的方法实时查看。
我现在就写这个辅助软件,哈哈。

可以用正则获取所有的标签
<[^<>]+>
再做进一步整理:如去重、排序、删除不必要的标签属性等。

1 个赞

这个辅助软件满足需求吗?