最新的整句准确率评测结果如下:
第一名和第二名也就差一两个字。目前没有引入中文语法算法引擎,无法进一步提高准确率。
文艺基础版包含1000万词语,来源于各大开源的分词数据库,最大的数据来源是百度百科约400万标题。
文艺强化版包含2087万词语,增补的词语是作者自研的使用深度学习梯度下降算法获得的1000多万高质量词汇。
之前的版本,因为作者愚钝,不知道rime输入法可以在缺少词典源文件 *.dict.yaml 时利用预编译词典 *.table.bin 完成部署。
现在输入法切换非常流畅,安装包比起以前的版本,没有繁琐的操作,一键安装。
之前的版本缺点:需要安装vc运行库,需要替换词库索引,部署输入法需要漫长的等待,小狼毫助手修改输入法候选词语数量、修改字体无法生效。
现在,这些缺点统统没有了。
最小的安装包只有110MB,接近普通输入法的大小。完整版供有需要的发烧友使用。

鸿雁拼音输入法下载链接:
https://hong-yan.lanzouw.com/b00vvkivc
密码:1234
3 Likes
重启一下操作系统。
目前只有win 7 32bit不需要重启操作系统。
1 Like
重启了,可以用了。请问这个文艺基础版可以使用双拼吗?一直习惯用拼音加加的双拼。
双拼 有多种双拼方案,目前在完整版中有。
其实下载一下完整版,把配置双拼配置方案中的数据库文件从hongyan_pinyin_simp 修改成 hongyan_pinyin_simp_wenyi ,重新部署就可以了。
C:\Program Files (x86)\Rime\weasel-7.0.0.0\data\default.yaml
C:\Program Files (x86)\Rime\weasel-7.0.0.0\data\hongyan_pinyin_simp_pyjj.schema.yaml
从完整版提取这两个文件
把C:\Program Files (x86)\Rime\weasel-7.0.0.0\data\default.custom.yaml
方案改成 hongyan_pinyin_simp_pyjj
hongyan_pinyin_simp_pyjj.schema.yaml文件中 hongyan_pinyin_simp 替换成hongyan_pinyin_simp_wenyi 并保存
重新部署就可以了。
1 Like
aimdict
10
但也必须安装完完整版才能找到那两个文件啊。而安装完整版又要求卸载刚才安装的文艺版。建议能在文艺版中也加入双拼方案,应该增加不了多大体积吧?
elisir
11
巨大的数据库是一回事,个人觉得如何针对这些分词数据库分类,再赋予不同的权重,以便产生的词频更适合目标人群。
现在在用rime,挂的四叶草方案(好像转的搜狗)+五笔。四叶草在输入拼音时,就看出明显针对简体用户优化来了。也就是它的词库中大陆简体词汇的权重要比繁体大。
同样,在分类时,现代要比古代材料权重大,网络小说、新闻报道、近现代文学等等这些权重怎么分着,是个问题。
大词库的好处,在于一次性匹配编码,但同样会带来存储和检索的问题。要不要实现对词库的并行检索。
在互联网时代,如何利用好巨量的资源,产出一个比较合理的词频库(可以是针对简体、繁体分别制作),这个更有意义。
这是一个外行在接触rime后的一点浅薄思考。
希望你做的输入法好用。会试用。
但这么大体积,对普通用户来说不太友好。
1 Like
aimdict
12
安装完整版成功,双拼也设置成功,就使用一下完整版吧,感谢发布!原来一直使用的百度拼音,只要一自动升级,原来的词库就找不到了,实在难用!
aimdict
13
请教自己新造的词怎么保存?我发现保存不了。造好新词,下次输入还是没有。
文艺基础版就是应这样的需求诞生的。只有110MB。
一般的输入法也就50-70MB,讯飞输入法100MB。
aimdict
17
呵呵,完整版既然这么大了,也不在乎开启用户词典吧?看来还得继续完善啊!
主要是因为,完整版面对的是整句输入环境,开启用户词典会调整同一个拼音的候选词语顺序。
这样的整句输入的准确率会不稳定。
小狼毫助手是可以设置调整的。
1 Like
完整版默认没有开启用户造词。
使用小狼毫助手是可以对任何一个正在使用的输入方案开启用户造词的。
rime输入法的特点就是可以根据自己的需求定制,小狼毫助手提供一个图形化修改的界面。