鸿雁输入法——整句输入法中一颗冉冉升起的新星

刚好我手头有这方面的数据

牛津英语词典、牛津高阶英汉双解词典、朗文当代高级英语辞典、韦氏高阶英汉双解词典、新牛津英汉双解大词典等十多个词典提取大概100万个词头,用这个100万个字典去遍历,将海词和百度翻译的简明中英翻译本地化。本地化的数据速度更快。

百度翻译有66万条数据

海词有32万条数据

rime输入法的提示并不智能,不能词语联想

其实此可以对字母 的码表做一些手脚

sometime

拆分为7个子码表
s
so
som
some
somet
someti
sometim
sometime

sometime 的词频等于2,其他的词频是1

就可以实现词语联想,基本上包括词语所有的变化形式

而且是一个经过验证的66万+的词库

如果没有候选词,说明这个词语基本上是错误的或者是罕见的词语,这样可以通过候选词语的有无查看英语的正确性,还可以实现英语单词的词语联想