大辞泉转制的ankihelper格式的txt

链接:https://www.aliyundrive.com/s/CwwJ3vHH2xU
蓝奏云免登录密码:g6fm

效果:

实际上这个词典还是个半成品,对日语单词变形的支持不是很好。其实,如果GoldenDic习惯用Ctrl+C+C 查词的话,也应该会注意到有类似的问题,moji、欧路、沪江稍微好一点。

所以斗胆拿这个半成品的词典来抛砖引玉,谈谈我认为日语字典的词头编撰时可以优化的地方和想出的一些办法(基本都是利用Unicode 编码规律),希望大家能不吝赐教,给出一些更好的办法。

  1. 拟声拟态词很多时候写片假名——一般词典的词头都是平假名, 平假名(12353-12438) + 96 = 片假名 (12449-12534)
  2. 形容词的词尾变形 いく(同上 い =12356 く=12367)
  3. 动词变形(同上变换一次假名不行了233……虽然日语动词的词尾都在う段(12358、……),变换也在基本在同段进行,但不是绝对,比如う的连一 い 12356 (-2)……,连二 った 12387,还有拨音变等等)本来猜测机器翻译领域也许会有这方面的算法和结果可以直接用,但找了很久都没找到,只能尝试自己写,但花了一周还是惨不忍睹——遗漏的变形太多了,倒是成功巩固了动词变形 :joy:
  4. 复合动词 一般来说第二个动词不会写汉字,这个暂时一点头绪都没有。
1 个赞