请教上述词表是否已经包含 清华大学开源词库 THUOCL?
若已包含,我就不必再重复了。
请教上述词表是否已经包含 清华大学开源词库 THUOCL?
若已包含,我就不必再重复了。
这个词库是几个本科生和博士生做的,指导老师是教授。
质量一般。
在国内汉语学术研究比较厉害的有 北京师范大学 北京语言大学 哈尔滨工业大学。
您应该是内存不够
在win 10平台是可以正常编译词库索引的。
这里有预编译好的词库索引提供下载。
明白了!感谢!我最终采取的方案如下,供各位参考。
主要改动:(1)hongyan分单字和词组,以便多输入法组合使用;(2)删除hongyan词频在300以下的低频词组,以便在windows下腾出一些空间给其他自定义词组。
---
name: vimwei
version: "2022.09.18"
sort: by_weight
import_tables:
# 基础词表
- hongyan.base # 仅单字
- hongyan.phrase # 词频在300以上的词组
- sogou.new.words # 流行的新词库,定期自动更新
# 个性化词库
- vimwei.inbox
- vimwei.contacts
- vimwei.finance
- vimwei.group
...
替换后,瞬间就恢复为原样了
谁能教教我这个输入法怎么用?装上之后就一个图标,也没有状态条,只能输入英文,没法切换到中文。
windows版
1 先卸载旧版本的鸿雁输入法和小狼毫输入法
2 安装vc 2015运行库,目前不支持win 11,在win 7 32bit、win 7 64bit、win 10 64bit均可正常运行。
3 安装 鸿雁输入法5.0.exe 到c盘默认位置
4 安装 Windows版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.exe
5 部分电脑需要重启操作系统才能正常使用
鸿雁输入法默认的输入方案是“鸿雁拼音·全拼”,习惯使用整句输入模式的用户,完成上面的5个步骤就可以正常使用了
对于习惯使用词语作为输入单元的用户,请跳过步骤4(这个增强包用于整句输入的),进行下面的设置
a. 右键点击任务栏“中”字图标,弹出菜单
b. 点击 “输入法设定”
c. 在输入法菜单中,取消“鸿雁拼音·全拼”前面的复选框,把“鸿雁拼音+腾讯词库测试版·全拼”的复选框选中
d. 点击确定,生成“鸿雁拼音+腾讯词库测试版·全拼”的词库索引
“鸿雁拼音+腾讯词库测试版·全拼”使用空格键和数字键上屏,没有使用语句流引擎,候选词语更为准确,更接近语义学上的合格词语
安卓版 需要安装3次
1 鸿雁手机输入法5.0.apk
2 鸿雁手机输入法5.0配置包(解压到手机rime目录即可).zip
3 Android版_鸿雁输入法v5.0预编译词库索引(拼音、五笔)_2471万词语增强包.zip
上述每一个步骤的作用
1 安装基本的软件
2 用最小的输入法词库生成索引
3 替换词库索引
安装过程有点繁琐。没有状态条,没法调用软键盘。不喜欢竖排选字,不能设置字体样式。
你说的这些属于高级功能,都可以自行学习定制,几个配置参数就搞定了。
是我疏忽了,覆盖索引前应该停止鸿雁拼音算法服务后台
这个是自解压包,会自动安装词库索引的,停止算法后台,重启算法后台,不需要手动复制
请教:目前“hongyan_pinyin_simp_tengxun.schema.yaml”中默认是express_editor,也就是默认是词语模式而非整句模式?
是的
整句模式下数字键不能直接上屏
这对于习惯使用拆分语句为词语为输入习惯的用户更为方便。
这个方案的弊端就是,整句输入准确率降低。
多谢支持
以上问题基本解决了,已经很不错了~
期待能够改进的地方:
1、词库词频顺序随着用户的手动选择能够自动调节;
2、双拼方案中,通过“;'”,也就是分号和单引号选择第二、第三候选词;(这里有示例:https://gist.github.com/lotem/2390510)
3、预编译方案最好能直接加入安装包中,直接释放。
这一段中有“词库”“预编译”需要手动选择!
挺棒的,得要要慢慢熟悉。
请问大神英文可以设置联想打字吗?
刚好我手头有这方面的数据
牛津英语词典、牛津高阶英汉双解词典、朗文当代高级英语辞典、韦氏高阶英汉双解词典、新牛津英汉双解大词典等十多个词典提取大概100万个词头,用这个100万个字典去遍历,将海词和百度翻译的简明中英翻译本地化。本地化的数据速度更快。
百度翻译有66万条数据
海词有32万条数据
rime输入法的提示并不智能,不能词语联想
其实此可以对字母 的码表做一些手脚
sometime
拆分为7个子码表
s
so
som
some
somet
someti
sometim
sometime
sometime 的词频等于2,其他的词频是1
就可以实现词语联想,基本上包括词语所有的变化形式
而且是一个经过验证的66万+的词库
如果没有候选词,说明这个词语基本上是错误的或者是罕见的词语,这样可以通过候选词语的有无查看英语的正确性,还可以实现英语单词的词语联想
本人一直在用百度输入法,它的英文联想挺方便的。
还有今后也会考虑更新鸿雁输入法皮肤美化吧?
这个不用担心,搞视觉界面设计、前端、视觉设计的人才大把的。
Koodo Reader
这个epub阅读器界面非常棒。
只要有足够多的人使用,这个工作自然会有人做
# 引入 Easy English 实现中英文混输
__include: easy_en:/patch
# 英文排序优先级,默认为-1,可以调整为0-0.5左右的数值,值越大英文单词越靠前
easy_en/initial_quality: 0.3
刚才试用了一下整句模式,没搞清楚是如何选词的。。。数字键没用。。。