《汉语大词典》注音校对

我现在也在改《汉语大词典》的自动注音。

还好用Emeditor上手了,能够批量替换。

Emeditor实现快速词典校对操作

1.find extract “chánɡ”, save as data.txt.

2.find extract “場” in data.txt

3.建立一个emeditor.xls

格式:

on dat1 dat2 R

4.复制用 "場"抽出来的资料,贴到dat1栏。

5.更改emeditor中用 "場"抽出来的资料,复制后贴到dat2栏。

6.用on填满第一栏,用R填满第四栏。

7.将Excel文档save as unicode txt,文件名:emeditor.tsv

8.在Emeditor中,Search — Replace in files — 右下角 Import
导入tsv文件。

9.在左边In folder选择文件夹。File types选择*.txt。
(在该文件夹中放进所需处理的文本。注意不会选择“look in subfolder”,以免误伤子文件夹中的文件。最好新开一个temp文件夹处理这种需要批量替换的文件。)
(多文件,选择Save Backup,只有一个文件,选择Keep Modified files open。)

10.点按右上角的Batch Replace All。

The faster method

第6步骤以后,不必转存为text。

接入下面的步骤:

1.选择Excel中所有数据,复制。

2.在Emeditor中,Search — Replace in files,假如替换表中有数据,先选择一切数据,删除。

3.直接把Excel中的数据,通过剪贴板粘贴到Emeditor的复制表中,直接就能用了。

本来以为第一字的自动注音不会错,只有后面的多音字可能错。

刚刚发现:“器”的注音全错了,应该是去声,变成阴平,不知怎么搞的。

再如这个注音:

一十八般兵器yīshíbāpánbīnɡqì

把“般”注成pán,真是离奇、离谱的错误啊!可以用“灾难性”来形容!