制作词典的一些心得

一、excel文件的合并
用wps非常方便
二、数据遗漏检查
数据所在网址如是连续的,在抓取时连网址一并抓取,然后用excel查漏。具体做法是先把网址中的数字复制到表格A列,在B列输入公式=SMALL(IF(FREQUENCY(a:a,ROW($1:$32821))=0,MMULT(ROW($1:$32822),1)),ROW(A1))进行计算。其中32821等替换为网址中的最大数字。
三、参见跳转
如果参见后的条目较多,可先用正则式(“.+?”。)全选相应文字,再用(“.+?”)在选区内替换。
四、目录制作
如果是多级目录时制作较为麻烦,利用excel,一级目录在第一列,二级第二列,依次类推,其中细节处理用好公式,不再详述,最后目录加上p标签,条目加上a标签即可。
五、特殊序号
处理特殊序号,如带圈数字,可上网查找其起始值的unicode码,如\u2460,一般终止值设为\u2490已经够用,在emeditor中用[\x{2460}-\x{2490}]即可对其处理。

以上是自己摸索到的一点经验,不揣浅陋,不当之处望指正,更希望能起到抛砖引玉之效。

1 个赞

词典相关的技术发这个区。
image

那请您开个教程帖讲讲你是怎么做的 :smiley:

老兄把你的txt文档也发上来瞅瞅呗

怎么都删了,昨天网站抽风,还没来得及学习呢

在哪里?没找到。