四库全书总目提要: 求制作一个繁简通检的版本

我是鼓励自己动手,丰衣足食的。提供个思路:
1、解开mdx为txt
2、用ultraedit等编辑器批量正则替换txt中的\n为####之类的特殊符号,再正则替换</></>\n,使得每个词条占单独一行,保存。
3、将上述txt导入excel,分隔符选####,目的是让第一列是词头部分,第二列是词条内容,第三列为</>,用繁简转换工具只转第一列
4、将繁简转换后的文本拷贝回ultraedit等编辑器,正则替换\t为\n,还原为编译前的版式
5、将符合规范的txt重新打包为mdx

过程中可能会碰到小坑,自己多试一试就明白了

1 个赞