图片词典制作最基本正则
基本思路
图片词典的制作的基本思路是在词头和图像之间建立连接,连接的中间环节就是页码:
词头 → 页码数字 → 图片文件名
所以,制作图片词典需要两个步骤:
- 词头与页码的跳转;
- 页码与图片文件的跳转。
这两个步骤分别需要两个基本正则:
- 词头与页码的跳转
^(.+)\t(.+)
\1\n@@@LINK=ABCD_\2\n</>
- 页码与图片文件的跳转
^(.+)\t(.+)\t(.+)
ABCD_\1\n<img src="/ABCD_\1.tif" width="100%"><br/><center> <a href="entry://ABCD_\2">上一页</a> <a href="entry://ABCD_\3">下一页</a></center>\n</>
1. 页码与图片文件的跳转
页码与图片文件的跳转,只需要知道正文有多少页就可以开始做。简单的做法是生成tab分割的三栏数列,其数字分别代表上一页,本页,下一页。但每次都要生成显然麻烦。简单的做法就是生成一个3000行的tsv,只要知道正文页数,直接从其中复制过来就可以了。
生成方式:
- emeditor打开制表符格式
- Ctrl+Q搜索编号,设置快捷键为Ctrl+shift+B
- 第一栏,初始编号000,增量1,3000行
- 第二栏,初始编号001,增量1,3000行
- 第一栏,初始编号002,增量1,3000行
2. 词头与页码的跳转
词头与页码的跳转需要在整理完索引之后才能开始做。但一般来说,索引的页码是1,2…99…3000,需要先把十位数前面补上一个0,再把个位数前面补上00,以配合页码和文件名之间的跳转。
可以使用正则:
十位数前面补上0:
\t(\d{2}\n)
\t0\1
个位数前面补上00:
\t(\d{1}\n)
\t00\1
这一步使用Emeditor的垂直编辑其实更为方便
合成
合成以上两步所得文本,替换ABCD_为实际的正文图像文件名即可。