查错
分为两块
1. 词头查错。
a. 遍历词头,用平假名在広辞苑等辞典查询条目
b. 如果查到了,并且是汉字的差异,记录映射到X:原汉字-新汉字
c. 遍历完毕。对X进行映射分割
d. 如果映射的原汉字为中文常用汉字,分类为映射a,否则分类为映射b
2. 释义查错
a. 遍历条目,遍历其日文释义与日文例句
b. 对于不是日文常用汉字且不在映射X里的汉字,如果其在中日形近汉字表中,记录映射到Y:原中字-形近字;否则划分至“未知”分类U
c. 遍历完毕。对Y进行映射分割,参考1-d,中文常用字至映射c,否则到映射d
d. 人工筛选,将U中能猜到映射关系的添加至映射c或d
修复
3. 全文根据映射b+映射d全字替换
4. 遍历条目。词头根据映射a+映射c替换,日文释义和日文例句根据映射Y+映射c替换
5. 不对U中的字进行处理。小于10个且在全文用到的地方很少
[Is there a special way to use the dictionary? I can’t search any item by itself. For example, the first item shown in your pic 阿吽の呼吸, it doesn’t appear in the dic if you type it like that. Indeed, you can only find the first word, 阿吽。