[改版]新华成语大词典(图文综合版)2023.7.17

昨天又从前到后粗略看了一遍帖子,深感众口难调。所以花了点时间将源文件重新整理了一份,带来了今天的重头戏
——新华成语自由定制版

我希望小伙伴们都能得到自己中意的成语词典。

使用说明:
字体、图标、样式表都已提供,mdx整出来就能用了。压缩包内有多个文本文件,使用bat文件按需合并,然后用官方打包软件打包成mdx文件就完成了。
官方绿软,简单易用,安全无毒!

压缩包中的词典源文件:
1图像页码.txt
2主词条17819.txt
3无内容词条8739.txt
4单字反查(全词条).txt
4单字反查(精简).txt
M君:舊版相關詞重複了太多內容。新版簡略而更好用。
5简繁通搜(单字).txt
6简繁通搜(成语)20283.txt
6简繁通搜(成语+冗余)22131.txt
增加了1800余条繁体跳转。但是吧,多的未必就是好的,自行研究吧
7补充跳转117.txt
一些词典中提到但没有单列词头的成语及一些词典中未指出的其它写法
8无内容词条跳转8739.txt

目前提供了三个bat供参考,更多版本请自行研究。

图文加强版.bat
copy 1图像页码.txt + 2主词条17819.txt + 3无内容词条8739.txt + 8无内容词条跳转8739.txt + 4单字反查(全词条).txt + 5简繁通搜(单字).txt + 6简繁通搜(成语).txt + 7补充跳转117.txt finish.txt

finish.txt 是合并后的文件, bat文件可以用记事本编辑。注意顺序哦。
不过这里有两个小问题:

  1. bat文件中不能有中文,合并时要将中文删去。

copy 1.txt + 2.txt + 3.txt + 8.txt + 4.txt + 5.txt + 6.txt + 7.txt finish.txt

image

  1. 合并后,在合并的文件最后会多出一个字符。打包后会多出来一个空的词条,对其它词条未见影响。也因为这点,我发现另一部词典应该也是这样合并源文件的 :grin:
    image

想请教一下懂DOS的大神:合并时,如何消除这个多出来的字符?


以下是高级用法,要在高级文本编辑器中操作,如:Em。高级用户可跳过 :goutou:

  1. 图文加强版:无内容词条中的参见词条跳转链接可以删了。
见“<a href="entry://([^<>]+)">\1</a>”。
替换为:
见“\1”。
  1. 图文瘦身版:也作词条的跳转链接可以删了。
<yz>也作“<a href="entry://([^<>]+)">\1</a>”。
替换为:
<yz>也作“\1”。
  1. 纯文字版:页码的跳转链接可以删了。
<pg><a href="entry://CYCD(\d{4})">\1</a></pg>
替换为:
<pg>\1</pg>
  1. 纯文字不要“单字反查”。词头的跳转链接也可以删了。

copy 2.txt + 7.txt + 8.txt finish.txt

<a href="entry://(\p{Han})">\1</a>
替换为:
\1
  1. 一些注意项来源是词典本身,感觉多余,欲删。
<lai>——来自《新华成语大词典》</lai>
替换为空。

替换之后再合并,减少误伤。

重要说明:
以上正则都是瞎搞的,请谨慎使用,玩坏不保 :laughing:

今天是个特殊的日子,我用特殊的方式来纪念。

2 个赞