汉字及汉字输入法软件讨论

桃子要那么多人干什么,莫非想另立中央?

人数不够,他没动力弄整句:smiley:

错误的广告语:形码门槛高,加上社会心浮气躁,大家不肯学音形结合。:heavy_multiplication_x:
正确的广告语:拼音虽然好用,但在查生僻字的时候还是有明显短板,特别是对中文系和研究中文的人。:heavy_check_mark:

1 个赞

总是有会写不会念或会念不会写。
所以需要两种输入法。

1 个赞

歪个楼,想请教一下各位折腾过输入法的大佬们:

很多从未学过日语的中文的母语者在第一次接触日语汉字时,都会试着按中文拼音的方式去拼读「躊躇(踌躇)」等词。而采用日语输入法输入「躊躇」时,需要在键盘上按「tyuutyou」、中文输入「踌躇」是按的「chouchu」,在中文输入法中「tyuutyou」输出的文字没有什么用(排在第一位的是“体育与他有”,基于搜狗输入法测试),而在微软日语输入法中「chouchu」的输出第一位是「張仲景」(但实际对应的是chouchuukei),也可以认为「chouchu」没有对应一个真正的日语单词,所以本人一直以来有个猜想:

查英语单词时,我很少看到有人会专门切输入法;但我在很多日语学习者都看到:「打了半截才发现自己还在中文输入法,不得不删了已经上屏的内容,切换为日语输入法重新再打一遍」的现象。

那么,日语和中文的输入法其实是不是可以兼容呢?就像上面的例子,我们在中文输入法下输入一个日语单词,最终并没有对应有意义的中文,也就是说几乎没有干扰中文。

不过,我读了《数学之美》讲解Google基于统计学原理的中文输入法算法后,意识到「整句输入不是一个简单的问题」,开始只关注在「单词」这个层面上,「中日输入法是否可以兼容」的问题。

依各位前辈在各种中文输入法间来回尝试体验的「经验」和「直觉」来看,「词组级的输入,中日输入法是否可以兼容」的问题的答案是什么呢?

作为一个日语专业的学生,我在去年注意到了这个问题,之后一直在观察,目前的感觉是「词组级的输入,中日输入法可以兼容」。

本来想作为自己的毕业论文选题,但觉得这个方向太过奇怪,就放弃了,也没有用中日文输入法的词库进行比对计算。五一节想给自己找点东西研究下,目前的的想法就是:

  1. 确认中文输入法的词库中的拼音是否出现在日文输入法的词库(比如 chouchu 是否出现在日语词库)
  2. 确认日文输入法的词库中的罗马音是否出现在输入法的词库(比如 tyuutyou是否出现在中文词库)
  3. 计算相似度,比如 chouchu 和日文输入法词库中哪些比较相似(模拟真实的输入过程)
  4. 计算并比较几种常见的双拼方案的词库

如果有研究语言学的大佬路过,可以从语音学的角度大概分析下这个现象么?

虽然已决定不在纯语言相关的专业继续深造,但对这个问题的答案实在比较好奇(主要是每次发现自己没切输入法就会想到这个猜想233

1 个赞

Google浏览器内置的分词词库,中日词组是混合在一起的,说明词组输入是可以兼容的。拼音/罗马音不确定。

1 个赞

仁兄的想法很有意思啊,希望可以研究出东西了 ::

这个尝试有意思,支持试一试。觉得极点中文与搜狗五笔输入法做的好用,其中一个点就是可以五笔与拼音混输,虽然大部分时候用五笔,但难免有些字会忘了怎么写要用拼音临时应急。只是觉得这个五笔拼音混输还做的不够人性化。