我现在也在改《汉语大词典》的自动注音。
还好用Emeditor上手了,能够批量替换。
1.find extract “chánɡ”, save as data.txt.
2.find extract “場” in data.txt
3.建立一个emeditor.xls
格式:
on dat1 dat2 R
4.复制用 "場"抽出来的资料,贴到dat1栏。
5.更改emeditor中用 "場"抽出来的资料,复制后贴到dat2栏。
6.用on填满第一栏,用R填满第四栏。
7.将Excel文档save as unicode txt,文件名:emeditor.tsv
8.在Emeditor中,Search — Replace in files — 右下角 Import
导入tsv文件。
9.在左边In folder选择文件夹。File types选择*.txt。
(在该文件夹中放进所需处理的文本。注意不会选择“look in subfolder”,以免误伤子文件夹中的文件。最好新开一个temp文件夹处理这种需要批量替换的文件。)
(多文件,选择Save Backup,只有一个文件,选择Keep Modified files open。)
10.点按右上角的Batch Replace All。
The faster method
第6步骤以后,不必转存为text。
接入下面的步骤:
1.选择Excel中所有数据,复制。
2.在Emeditor中,Search — Replace in files,假如替换表中有数据,先选择一切数据,删除。
3.直接把Excel中的数据,通过剪贴板粘贴到Emeditor的复制表中,直接就能用了。
本来以为第一字的自动注音不会错,只有后面的多音字可能错。
刚刚发现:“器”的注音全错了,应该是去声,变成阴平,不知怎么搞的。
再如这个注音:
一十八般兵器yīshíbāpánbīnɡqì
把“般”注成pán,真是离奇、离谱的错误啊!可以用“灾难性”来形容!