鸿雁输入法——整句输入法中一颗冉冉升起的新星

9月17日更新版5.0安装成功后,选择拼音、双拼正常;但选择“鸿雁拼音+腾讯词库测试版·全拼”后就一直是维护中,多次卸载安装都是如此。
发现“hongyan_pinyin_simp_tengxun.table.bin”这个文件内容是空白。
估计预编译方式可行 :smiling_face:

请教上述词表是否已经包含 清华大学开源词库 THUOCL?

若已包含,我就不必再重复了。

这个词库是几个本科生和博士生做的,指导老师是教授。

质量一般。

在国内汉语学术研究比较厉害的有 北京师范大学 北京语言大学 哈尔滨工业大学。

1 个赞

您应该是内存不够
在win 10平台是可以正常编译词库索引的。

这里有预编译好的词库索引提供下载。

明白了!感谢!我最终采取的方案如下,供各位参考。
主要改动:(1)hongyan分单字和词组,以便多输入法组合使用;(2)删除hongyan词频在300以下的低频词组,以便在windows下腾出一些空间给其他自定义词组。

---
name: vimwei
version: "2022.09.18"
sort: by_weight
import_tables:
  # 基础词表
  - hongyan.base   # 仅单字
  - hongyan.phrase  # 词频在300以上的词组
  - sogou.new.words  # 流行的新词库,定期自动更新
  # 个性化词库
  - vimwei.inbox
  - vimwei.contacts
  - vimwei.finance
  - vimwei.group
...

替换后,瞬间就恢复为原样了 :joy:

谁能教教我这个输入法怎么用?装上之后就一个图标,也没有状态条,只能输入英文,没法切换到中文。

windows版

1 先卸载旧版本的鸿雁输入法和小狼毫输入法
2 安装vc 2015运行库,目前不支持win 11,在win 7 32bit、win 7 64bit、win 10 64bit均可正常运行。
3 安装 鸿雁输入法5.0.exe 到c盘默认位置
4 安装 Windows版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.exe
5 部分电脑需要重启操作系统才能正常使用

鸿雁输入法默认的输入方案是“鸿雁拼音·全拼”,习惯使用整句输入模式的用户,完成上面的5个步骤就可以正常使用了

对于习惯使用词语作为输入单元的用户,请跳过步骤4(这个增强包用于整句输入的),进行下面的设置

a. 右键点击任务栏“中”字图标,弹出菜单
b. 点击 “输入法设定”
c. 在输入法菜单中,取消“鸿雁拼音·全拼”前面的复选框,把“鸿雁拼音+腾讯词库测试版·全拼”的复选框选中
d. 点击确定,生成“鸿雁拼音+腾讯词库测试版·全拼”的词库索引

“鸿雁拼音+腾讯词库测试版·全拼”使用空格键和数字键上屏,没有使用语句流引擎,候选词语更为准确,更接近语义学上的合格词语

安卓版 需要安装3次

1 鸿雁手机输入法5.0.apk
2 鸿雁手机输入法5.0配置包(解压到手机rime目录即可).zip
3 Android版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.zip

上述每一个步骤的作用

1 安装基本的软件
2 用最小的输入法词库生成索引
3 替换词库索引

安装过程有点繁琐。没有状态条,没法调用软键盘。不喜欢竖排选字,不能设置字体样式。

你说的这些属于高级功能,都可以自行学习定制,几个配置参数就搞定了。

1 个赞

是我疏忽了,覆盖索引前应该停止鸿雁拼音算法服务后台

这个是自解压包,会自动安装词库索引的,停止算法后台,重启算法后台,不需要手动复制

小狼毫助手可以在图形化的界面设置这些参数。

请教:目前“hongyan_pinyin_simp_tengxun.schema.yaml”中默认是express_editor,也就是默认是词语模式而非整句模式?

是的

整句模式下数字键不能直接上屏

这对于习惯使用拆分语句为词语为输入习惯的用户更为方便。

这个方案的弊端就是,整句输入准确率降低。

1 个赞

多谢支持:grin::pray:t2:
以上问题基本解决了,已经很不错了~
期待能够改进的地方:
1、词库词频顺序随着用户的手动选择能够自动调节;
2、双拼方案中,通过“;'”,也就是分号和单引号选择第二、第三候选词;(这里有示例:https://gist.github.com/lotem/2390510)
3、预编译方案最好能直接加入安装包中,直接释放。
这一段中有“词库”“预编译”需要手动选择!

挺棒的,得要要慢慢熟悉。
请问大神英文可以设置联想打字吗?

刚好我手头有这方面的数据

牛津英语词典、牛津高阶英汉双解词典、朗文当代高级英语辞典、韦氏高阶英汉双解词典、新牛津英汉双解大词典等十多个词典提取大概100万个词头,用这个100万个字典去遍历,将海词和百度翻译的简明中英翻译本地化。本地化的数据速度更快。

百度翻译有66万条数据

海词有32万条数据

rime输入法的提示并不智能,不能词语联想

其实此可以对字母 的码表做一些手脚

sometime

拆分为7个子码表
s
so
som
some
somet
someti
sometim
sometime

sometime 的词频等于2,其他的词频是1

就可以实现词语联想,基本上包括词语所有的变化形式

而且是一个经过验证的66万+的词库

如果没有候选词,说明这个词语基本上是错误的或者是罕见的词语,这样可以通过候选词语的有无查看英语的正确性,还可以实现英语单词的词语联想

本人一直在用百度输入法,它的英文联想挺方便的。
还有今后也会考虑更新鸿雁输入法皮肤美化吧?

这个不用担心,搞视觉界面设计、前端、视觉设计的人才大把的。
Koodo Reader

这个epub阅读器界面非常棒。

只要有足够多的人使用,这个工作自然会有人做

  # 引入 Easy English 实现中英文混输
  __include: easy_en:/patch
  # 英文排序优先级,默认为-1,可以调整为0-0.5左右的数值,值越大英文单词越靠前
  easy_en/initial_quality: 0.3