鸿雁拼音输入法windows版和安卓版(拥有230万词库、基于220亿字典型语料库的统计词频)

安装在win11上无法打开使用,已经删除。

1 个赞

卧槽厉害厉害,目前用的rime小狼毫+四叶草简体拼音方案,试试你这个
四叶草有符号输入的,你这个有么?

实不相瞒,四叶草虽然有符号输入,这不是刚需。
我看过这个输入法的码表,看了之后就没有试用。

Win10 Home版能安装,但无法使用,1.0&2.0版均如此。
小狼毫没问题。
能否把这个词库直接转换到小狼毫?谢谢!

你没有安装vc 2015运行库吧

这个输入法就是rime修改名称和一些配置而已,在 win 10 64bit ,win7 32bit 64bit
新装的操作系统只要安装vc 2015运行库都能正常运行,要不你重启下操作系统

VC 2015运行库早就安装了的,VC各种库都安装了。
200多M的hongyan_pinyin_simp.table.bin这个文件是空白的!
各种安装、重启都试过了。 :joy:

1 个赞

模糊音怎么设置,四叶草博客上说建立clover.custom.yaml文件设置,我把clover.custom.yaml文件复制过去不起作用

目前不支持模糊音

1 个赞

加上吧,z zi c ch s sh是不好区分的
另外,这种情况如何解决


菜单重叠挡住了,四叶草有词频排序,以后更新会有吧期待

对大侠的golang实现的机械分词软件比较感兴趣 :grinning:

1 个赞

模糊音还是挺重要的,南方人普遍分不清前后鼻音,当年高考就是靠硬记,由于平时语音根本感受不到区别,时间长了就又分不清了。还有比如例举的“嗯”,说实话你说了之后我才知道原来拼音是ng而不是en :smiley:这些不规范的最好都有设置选项,总得是软件来迁就用户

2 个赞

下载安装后又卸载了。不习惯竖式出预选词的方式,好像还无法调整?而且自造了几个词,发现都没有保存,不能保存自造词吗?

2 个赞

clover和这个是两个不同的方案,得把clover方案中模糊音的设置弄到鸿㕍的方案中去

希望开源,或者是把词库独立出来,目前没有使用意向。

1 个赞

首先感谢楼主辛苦整理并无私分享!

然后看了介绍本不想下载的,但还是硬着头皮试了一下。然后,还没部署时间长就用回了百度——

2-3字词用单字全码输入委实不习惯,也不符合五笔输入法的设计初衷:
(1)重码是少了,但按键次数增加了太多。
(2)词语输入变得几乎没有意义,既然都是全码,我为什么要打词语呢?为单字编码显然比为词语编码更熟练。
(3)4字以上每字取一码也缺乏实用性。理由有二:一是五笔要快靠的是熟练,4字以上的词(句)因不常用所以没法熟练,一字一码会更慢;二是码长不固定便放弃了四码惟一直接上屏。如此计算,此方案输入句子估计会比拆分为单字+2/3字词(四码)输入慢不少。

看来楼主确实不是五笔使用者,五笔虽然重码少只是相对的,并不是要绝对避免重码,而应该是在按键次数与重码之间取得一种平衡,手机上输入更是如此。候选只要在第一页(屏)就只会增加一次击键(点触),所以楼主的工作最可贵、最有用的就是对词频的整理!而对编码规则的更改,反倒适得其反了。

我手机上用百度输入法五笔,而且是十八键布局,重码自然不会少,但候选要翻页的情况真的不多。另一个亦形输入法(只能全键),导入了unicode13的所有汉字单字+常用词码表,重码也不见得就多了多少。并且相比之下,百度输入法因为有上下左右滑动输入,在准确输入标点和中英混输时比全键的亦形输入法更快!

用98的话可以试试[http://98wb.ysepan.com/]这小组的作品,挺完善了

我想要的“完美输入法”应该满足这些条件(重要性由高到低):
(1)能够自定义皮肤布局——手机上全键盘按键太小,且爱美之心人皆有之;
(2)能上下左右滑动输入——方便输入标点、加入快捷键;
(3)一个优秀的词频排序——常用候选近乎总在第一,至少在第一屏;
(4)四码惟一直接上屏+其他方便输入的设定;
(5)小,快,稳;
(6)离线,无广告……
(7)拼音五笔混输或切换方便。

目前来看,还是只能用大厂的,定制版+ROOT下调校基本符合要求,当然,为了(3)只得联网。

1 个赞

形码我是打单字的,一个词都不打 :joy:

你所述的完美输入法,理论上应该存在,实现起来代价有些高。

以前的五笔输入法词库词库数量也就数万,现在数量是230万。
以前的五笔输入法分词是人工分词,现在是机械分词。

如果要做到四码词组上屏,需要对2-3个字的词语极度精简,输入法2-4个字的词语有180万,两个字的词语,机械分词有70-80万,来自词典和百科的标准词语有50多万。数量极其庞大。
你想象词组数量长了10倍,20倍,重码率涨了多少?

4个字以上上的词语数量不是很多,估计最多十万。

目前的方案下,就是2-3个字的词语虽然用全码,但是几乎不用选词。

你自己用全拼,会不会不习惯?

用全拼重码多,码长并不固定。

用五笔,码长固定,使用字形拆字,几乎不用对单字使用数字键,最多只需要对词组使用数字键,更多的情况,直接按空格候汉字进入输入法临时框,或者按下回车直接上屏。

空间换来效率,你说的2-4个字的拆词,本输入法的词语主要就是2-4个字的词语,刚好方便拆词。
唯一的代价就是按键次数多了,这是没有办法的事情。

你想按键少,还要词语多而且准确,那几乎不可能,

如果用阿尔法狗优化,那得花费多少时间精力?还不一定能够成功

我觉得吧,应该是之前的输入法使用短码把用户给惯坏了。

4次按键,输出一个词语,只适用于词库数量较小的时候。我想信息熵的理论可以解释。

用压缩包里的小狼毫助手设置了模糊音、自动词频,起作用了,你可以试试

1 个赞