词典制作周边工具(二):图片词典制作最基本正则

图片词典制作最基本正则

基本思路

图片词典的制作的基本思路是在词头和图像之间建立连接,连接的中间环节就是页码:

词头 → 页码数字 → 图片文件名

所以,制作图片词典需要两个步骤:

  1. 词头与页码的跳转;
  2. 页码与图片文件的跳转。

这两个步骤分别需要两个基本正则:

  1. 词头与页码的跳转
^(.+)\t(.+)
\1\n@@@LINK=ABCD_\2\n</>
  1. 页码与图片文件的跳转
^(.+)\t(.+)\t(.+)
ABCD_\1\n<img src="/ABCD_\1.tif" width="100%"><br/><center> <a href="entry://ABCD_\2">上一页</a> <a href="entry://ABCD_\3">下一页</a></center>\n</>

1. 页码与图片文件的跳转

页码与图片文件的跳转,只需要知道正文有多少页就可以开始做。简单的做法是生成tab分割的三栏数列,其数字分别代表上一页,本页,下一页。但每次都要生成显然麻烦。简单的做法就是生成一个3000行的tsv,只要知道正文页数,直接从其中复制过来就可以了。
生成方式:

  • emeditor打开制表符格式
  • Ctrl+Q搜索编号,设置快捷键为Ctrl+shift+B
  • 第一栏,初始编号000,增量1,3000行
  • 第二栏,初始编号001,增量1,3000行
  • 第一栏,初始编号002,增量1,3000行

2. 词头与页码的跳转

词头与页码的跳转需要在整理完索引之后才能开始做。但一般来说,索引的页码是1,2…99…3000,需要先把十位数前面补上一个0,再把个位数前面补上00,以配合页码和文件名之间的跳转。
可以使用正则:

十位数前面补上0:

\t(\d{2}\n)
\t0\1

个位数前面补上00:

\t(\d{1}\n)
\t00\1

这一步使用Emeditor的垂直编辑其实更为方便

合成

合成以上两步所得文本,替换ABCD_为实际的正文图像文件名即可。

7 个赞

请问“合成以上两步所得文本”,是不是把一个文本的内容,复制到另一个文本的最后?

是的,合成之后就是mdx源文件