鸿雁输入法——整句输入法中一颗冉冉升起的新星

要做一个勉强可用的英文输入法也不是不可以
sometime some 200
sometime somet 250
sometime someti 300
sometime sometim 350
sometime sometime 400
或者
sometime s o m e t i m e 200

这样和纯字母输入相比
多按了一次空格
不能纠正错误的拼写

这样的输入体验,并不是非常好的。只有从源代码中更改引擎

人工编撰词典的成本是非常高的。

现在的文艺版 搜集的词语有1000万。来自多个网络上的开源词库。

现代汉语词典就有5万多词语,就有砖头那么厚。如果没有足够的人力,想做一个大而全的输入法词库是几乎不可能的。

汉语输入已经很不错了 (尽管目前没有看到前句输入后,后句跳出联想词句) !最起码也让我等对英文输入,有个比较有效地输入运用吧?以后可以完善,不管是谁来做!
谢谢大师!

您说的情况当然是客观的情况,我这里只是向您提供一个思路, 李氏的方案也并非是要人工编纂词典,而是在现有的字词之上,更着力于句子,提高句子的复用率,比如您的数据库中的人民日报数据库,在优化句子的使用过后,在机关写作中就会非常好用,这就像工业的流水线一样,把一些标准的表达固定,并且提高复用率,并且及时学习出现的好的表达方式,这能够提高中文整体的使用水平。

这种句子的检选,一是可以大范围的从使用者扩大,二是可以人机合作,“半人马” 式的捡选,这在人工智能运用傅立叶法模仿人类的今天,是一条可能不错的路。

这个问题您最好问一下搜狗输入法的王小川或者黑马神拼的王励,他们可能是目前该领域最为权威的专家

我这里可把国家法律法规数据库纯文本20867个法律文件全部灌进一个输入法里面,只需要150GB的内存就可以生成词库索引了,所有的词语组合大概有5GB

我觉得这是很好的方向,可以提高一些语言的复用率,不过我还在想,李氏方案中,对中文表达的优化的问题,法国好像对法语本身也有优化的尝试,这个思路如果发展起来,模块化的表达对于中文本身的发展,可能会产生影响,比如第一时间推荐的用词,用句,以及建构在这种用词用句上的习惯。但这种影响中文未来的发展方向的可能,感觉需要一些共同的研究者的研究。

具体来说,输入法在承担这些基础的输入功能之外,还可以依靠词库,还有数据分析,承担一些近义词,或者同义句推荐的功能。

这种功能,我看妙笔一类的软件有发展,但妙笔的句库明显非常的局限于网络小说,而且并没有好的拓展的眼光。

但如果顺着这个思路走下去的话,也许未来不同的职业会有不同的输入法软件,或者模块,模块会根据写作内容自动推荐, 和写作者互动,可以为一些需要写作重复内容的使用者提供个性化的备选服务。

智能创作助手 Effidit(Efficient and Intelligent Editing) 是由腾讯 AI Lab 开发的一个研究性原型系统,探索用 AI 技术提升写作者的写作效率和创作体验(在线体验推荐使用 Chrome 或 Microsoft Edge 浏览器)
https://effidit.qq.com/

这里是 52万的英文单词码表,有需要自己鼓捣吧

1 个赞

麻烦给个安装说明!
谢谢!

1.把压缩包的yaml文件解压并覆盖到 C:\Program Files (x86)\Rime\weasel-5.0.0.0\data文件夹
2.清空用户文件夹的输入方案配置

dos下执行 
del /F /S /Q "%SYSTEMDRIVE%%HOMEPATH%\AppData\Roaming\Rime\*.*"



3. C:\Program Files (x86)\Rime\weasel-5.0.0.0\data\default.yaml

schema_list:
  - schema: hongyan_pinyin_simp
  - schema: hongyan_pinyin_simp_5bi
  - schema: hongyan_pinyin_simp_abc
  - schema: hongyan_pinyin_simp_ms
  - schema: hongyan_pinyin_simp_flypy
  - schema: hongyan_pinyin_simp_pyjj
  - schema: hongyan_pinyin_simp_zrm
  - schema: hongyan_pinyin_simp_tengxun

再添加一个
  - schema: hongyan_english

保存文件

4. C:\Program Files (x86)\Rime\weasel-5.0.0.0\data\default.custom.yaml

patch:
  schema_list:
    - {schema: hongyan_pinyin_simp_wenyi}

改为

patch:
  schema_list:
    - {schema: hongyan_english}

保存文件


5.重新部署

太感谢了!
怪我没有说清楚,我用的是手机安卓系统。

那就是rime文件夹下作相应的修改

麻烦给个安卓系统安装说明。

手机版和windows版本的文件是类似的

类比一下就可以了

安卓系统手机没法执行dos,就是没有清理原来设置,更改了patch后,切实可以打出英文联想词典,但是只是在原来的汉语输入状态下,可以使用,原来的英文设置状态下,只能一个字母一个字母的输入(跟原来输入相比没有变化)。
最关键的是,如何输入汉语(原来的汉语输入现在变成了英文联想)?

大师只能如此?

收到,感谢,很高兴看到这样的项目。

把英文码表提供出来是让你自己鼓捣

把 sometime
拆分成
sometime s 1
sometime so 2
sometime som 3
sometime some 4
sometime somet 5
sometime someti 6
sometime sometim 7
sometime sometime 8

就可以了

不过这样会让词库的大小膨胀几十倍

看上去想一想就能实现的功能,其实背后实现并不是那么容易的

Vim大神你好!现在想再次试一试“easy_en”。手机安卓系统可以吗?刚才查看#172,只看到Windows的。