鸿雁拼音输入法小体积安装包发布了

巨大的数据库是一回事,个人觉得如何针对这些分词数据库分类,再赋予不同的权重,以便产生的词频更适合目标人群。
现在在用rime,挂的四叶草方案(好像转的搜狗)+五笔。四叶草在输入拼音时,就看出明显针对简体用户优化来了。也就是它的词库中大陆简体词汇的权重要比繁体大。
同样,在分类时,现代要比古代材料权重大,网络小说、新闻报道、近现代文学等等这些权重怎么分着,是个问题。
大词库的好处,在于一次性匹配编码,但同样会带来存储和检索的问题。要不要实现对词库的并行检索。
在互联网时代,如何利用好巨量的资源,产出一个比较合理的词频库(可以是针对简体、繁体分别制作),这个更有意义。
这是一个外行在接触rime后的一点浅薄思考。
希望你做的输入法好用。会试用。
但这么大体积,对普通用户来说不太友好。

1 个赞