鸿雁输入法——整句输入法中一颗冉冉升起的新星

Vim · 2022 年9 月 18 日 05:59

请教上述词表是否已经包含清华大学开源词库 THUOCL？

若已包含，我就不必再重复了。

hongyan30 · 2022 年9 月 18 日 06:05

这个词库是几个本科生和博士生做的，指导老师是教授。

质量一般。

在国内汉语学术研究比较厉害的有北京师范大学北京语言大学哈尔滨工业大学。

hongyan30 · 2022 年9 月 18 日 06:21

您应该是内存不够
在win 10平台是可以正常编译词库索引的。

这里有预编译好的词库索引提供下载。

Vim · 2022 年9 月 18 日 06:23

明白了！感谢！我最终采取的方案如下，供各位参考。
主要改动：（1）hongyan分单字和词组，以便多输入法组合使用；（2）删除hongyan词频在300以下的低频词组，以便在windows下腾出一些空间给其他自定义词组。

---
name: vimwei
version: "2022.09.18"
sort: by_weight
import_tables:
  # 基础词表
  - hongyan.base   # 仅单字
  - hongyan.phrase  # 词频在300以上的词组
  - sogou.new.words  # 流行的新词库，定期自动更新
  # 个性化词库
  - vimwei.inbox
  - vimwei.contacts
  - vimwei.finance
  - vimwei.group
...

eBoy · 2022 年9 月 18 日 07:06

替换后，瞬间就恢复为原样了

knetxp · 2022 年9 月 18 日 07:30

谁能教教我这个输入法怎么用？装上之后就一个图标，也没有状态条，只能输入英文，没法切换到中文。

hongyan30 · 2022 年9 月 18 日 07:44

windows版

1 先卸载旧版本的鸿雁输入法和小狼毫输入法
2 安装vc 2015运行库，目前不支持win 11,在win 7 32bit、win 7 64bit、win 10 64bit均可正常运行。
3 安装鸿雁输入法5.0.exe 到c盘默认位置
4 安装 Windows版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.exe
5 部分电脑需要重启操作系统才能正常使用

鸿雁输入法默认的输入方案是“鸿雁拼音·全拼”，习惯使用整句输入模式的用户，完成上面的5个步骤就可以正常使用了

对于习惯使用词语作为输入单元的用户，请跳过步骤4(这个增强包用于整句输入的)，进行下面的设置

a. 右键点击任务栏“中”字图标，弹出菜单
b. 点击 “输入法设定”
c. 在输入法菜单中，取消“鸿雁拼音·全拼”前面的复选框，把“鸿雁拼音+腾讯词库测试版·全拼”的复选框选中
d. 点击确定，生成“鸿雁拼音+腾讯词库测试版·全拼”的词库索引

“鸿雁拼音+腾讯词库测试版·全拼”使用空格键和数字键上屏，没有使用语句流引擎，候选词语更为准确，更接近语义学上的合格词语

安卓版需要安装3次

1 鸿雁手机输入法5.0.apk
2 鸿雁手机输入法5.0配置包(解压到手机rime目录即可).zip
3 Android版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.zip

上述每一个步骤的作用

1 安装基本的软件
2 用最小的输入法词库生成索引
3 替换词库索引

knetxp · 2022 年9 月 18 日 07:49

安装过程有点繁琐。没有状态条，没法调用软键盘。不喜欢竖排选字，不能设置字体样式。

Vim · 2022 年9 月 18 日 07:51

你说的这些属于高级功能，都可以自行学习定制，几个配置参数就搞定了。

hongyan30 · 2022 年9 月 18 日 07:59

是我疏忽了，覆盖索引前应该停止鸿雁拼音算法服务后台

这个是自解压包，会自动安装词库索引的，停止算法后台，重启算法后台，不需要手动复制

hongyan30 · 2022 年9 月 18 日 08:00

小狼毫助手可以在图形化的界面设置这些参数。

Vim · 2022 年9 月 18 日 08:02

请教：目前“hongyan_pinyin_simp_tengxun.schema.yaml”中默认是express_editor，也就是默认是词语模式而非整句模式？

hongyan30 · 2022 年9 月 18 日 08:05

是的

整句模式下数字键不能直接上屏

这对于习惯使用拆分语句为词语为输入习惯的用户更为方便。

这个方案的弊端就是，整句输入准确率降低。

eBoy · 2022 年9 月 18 日 09:17

多谢支持
以上问题基本解决了，已经很不错了~
期待能够改进的地方：
1、词库词频顺序随着用户的手动选择能够自动调节；
2、双拼方案中，通过“;'”，也就是分号和单引号选择第二、第三候选词；（这里有示例：https://gist.github.com/lotem/2390510）
3、预编译方案最好能直接加入安装包中，直接释放。
这一段中有“词库”“预编译”需要手动选择！

brightd · 2022 年9 月 18 日 09:34

挺棒的，得要要慢慢熟悉。
请问大神英文可以设置联想打字吗？

hongyan30 · 2022 年9 月 18 日 09:49

刚好我手头有这方面的数据

牛津英语词典、牛津高阶英汉双解词典、朗文当代高级英语辞典、韦氏高阶英汉双解词典、新牛津英汉双解大词典等十多个词典提取大概100万个词头，用这个100万个字典去遍历，将海词和百度翻译的简明中英翻译本地化。本地化的数据速度更快。

百度翻译有66万条数据

海词有32万条数据

rime输入法的提示并不智能，不能词语联想

其实此可以对字母的码表做一些手脚

sometime

拆分为7个子码表
s
so
som
some
somet
someti
sometim
sometime

sometime 的词频等于2，其他的词频是1

就可以实现词语联想，基本上包括词语所有的变化形式

而且是一个经过验证的66万+的词库

如果没有候选词，说明这个词语基本上是错误的或者是罕见的词语，这样可以通过候选词语的有无查看英语的正确性，还可以实现英语单词的词语联想

brightd · 2022 年9 月 18 日 09:58

本人一直在用百度输入法，它的英文联想挺方便的。
还有今后也会考虑更新鸿雁输入法皮肤美化吧？

hongyan30 · 2022 年9 月 18 日 10:03

这个不用担心，搞视觉界面设计、前端、视觉设计的人才大把的。
Koodo Reader

这个epub阅读器界面非常棒。

只要有足够多的人使用，这个工作自然会有人做

Vim · 2022 年9 月 18 日 10:04

  # 引入 Easy English 实现中英文混输
  __include: easy_en:/patch
  # 英文排序优先级，默认为-1，可以调整为0-0.5左右的数值，值越大英文单词越靠前
  easy_en/initial_quality: 0.3

Vim · 2022 年9 月 18 日 10:09

刚才试用了一下整句模式，没搞清楚是如何选词的。。。数字键没用。。。