pdawiki发了一份,这里也发一份,希望出现更多好词典。
做Kindle词典的时候需要用到此库来为词头添加添加变形词,之前一直用的是 dsl2mobi 这个工具里面的 forms-EN.txt 规则集。后来发现内容不够多,只有十三万。于是又增加了两份进去。
合并的资源:
-
Webster’s Third New International Dictionary Unabridged 词典中的各单词变形。之前论坛有人发过,目前帖子状态未知。
-
GitHub - skywind3000/ECDICT: Free English to Chinese Dictionary Database 项目中,最新版(stardict.7z)数据内的各单词变形。
合并、去重后得出的数据为382344条。由于 ECDICT 项目中的数据太杂太乱以及质量参差不齐,可能会出现一些奇怪的变形词,不过不影响整体。
使用指南:
数据每行一条,格式为:
原型+冒号+空格+变形词[, 变形词2, 变形词3]
如: pollenize: pollenizing, pollenized, pollenizes
已合并去重,且全部转为了小写,调用函数搜索或者插入数据库后SQL查询时,一次判断为真即可直接返回,停止继续搜索。
顺手转了一份DB,sqlite直接调用即可:
TXT文本图:
db_English_Forms_Merged.zip (5.0 MB) txt_English_Forms_Merged.zip (2.3 MB)