真·哪里不会点哪里_日本語非辞書形辞典_v2

主要是以下几个方面:

  1. v2版本是从词性出发,v1只是根据词尾假名来判断有无处理的必要,像【あおじる】只有一个名词‘青汁’与之对应,并不需要像动词一样,替换词尾

  2. v2版本写了个脚本,用于制作mdx前,删除完全一样的词条,v1版本的マス就是重复词条最严重代表。得益于这个脚本,v2版本每次修改后不用小心翼翼地判断哪些部分是需要替换的(不然就相当于重复添加词条)

  3. v1版本对跳转语法进行了大量尝试,一开始注意到在输入框输入食べる/たべる/たべる【食べる】的结果是一样。这是因为大辞泉把意思全都放在了たべる【食べる】里面,输入食べる/たべる会自动跳到たべる【食べる】,但是这里使用的跳转语法@@@=只能跳一次,而且这一次必须要由词典软件的输入框发起,词典内部是不支持这种方法跳转的,后来没有删干净这部分尝试的词条
    图片

  4. <a href="bword://たべる【食べる】">这是尝试的第二种跳转语法,这个语法虽然能实现点击跳转,但也只能跳转一次,所以只能指向たべる【食べる】这样真正有意思的词条,不然跳转到食べる也是空白(后面也没有删干净)

  5. 最后采用的跳转语法是 <a href="entry://食べる#description">食べる</a></section></>,但一开始以为要能点击后自动跳转到<a href="entry://后面的食べる,那么一定要存在一个叫做食べる的词条,所以v1版本查原型能查到可以跳转的词条。但v2版本重新测试时才发现不需要,所以v2版本查原型或者跳转到原型,是看不到日本語非辞書形辞書的

综上,v1版本由于不熟悉mdx格式词典的语法,再加上制作流程混乱,导致一些尝试性添加的词条在发现无效后没有删除,做好之后,使用了一段时间意识到这些问题后,又投鼠忌器彻底摆烂

而v2版本吸取了教训,从0开始,只添加v1发现的真正有效的部分,所以体积下降了许多:)

2 个赞

2022-07-22 更新说明

  1. 补充一段动词词尾变形:ん、と、ち、ちゃ
  2. 补充形容词尾变形:す
  3. 补充假名可以灵活书写的单词以及相关变形:当たる・当る/素晴らしい・素晴しい等等
  4. 修复\n处理的逻辑,防止遗漏文件的最后一个词条

下载

论坛网盘:https://cloud.freemdict.com/index.php/s/Q62m2gk2dT5Lm99 30

蓝奏云:https://wwp.lanzouf.com/b011tnz6b 密码:8yp8

1 个赞

谢谢分享
期待继续完善~

2022-07-26-更新说明

  1. 删除部分无法跳转的词条,比如:湧き上(が)る
  2. 另外,基于纯算法的日本語非辞書形辞典_v3版本已经发布在论坛了,由于不是以mdx格式的词典的形式,v3版本可以调用EBWin、沙拉查词等软件,但目前存在一定的上手难度,有兴趣、愿意尝试的可以戳这篇文档v3_For_Quicker_Demo · 语雀 (yuque.com)

另外,想请教大家一个问题:像这个地方讨论的东西https://forum.freemdict.com/t/topic/14171/2有必要用暴力穷举的方法来一遍吗(或者说只有几个固定的,没有必要把1213个形容词都这么搞一遍,也没有必要在v3版本中用代码处理类似的变化)

大家可以用回应来进行投票:)

1 个赞

2022-07-30 更新说明

  1. 补充来自《三省堂スーパー大辞林3.0》的词条

按照计划这个应在上周六(7月30号)更新,将会融合MOJi、日本国语大辞典等有词性的词典,但是他们的标记方式实在太难处理了,折腾了几天楼主选择放弃,感兴趣的同学可以在技术细节部分阅读处理过程遇到的问题:)。

另外, v3_For_Quicker_Demo同步更新,除了新增词条之外,还支持返回多个结果,同时返回结果与v2基本一致

下载

论坛网盘:https://cloud.freemdict.com/index.php/s/Q62m2gk2dT5Lm99 30

蓝奏云:https://wwp.lanzouf.com/b011tnz6b 密码:8yp8

2022-10-15更新说明

很早就注意到的简体字和日语汉字的问题终于有了一个初步的解决方案,考虑到每个人的使用习惯和维护成本,单独发布成一个新项目

另外,针对日语复合动词的书写问题,最近也找到了一个初步的解决方法,预计下周更新,敬请期待:)

如果对项目的最新进展感兴趣的话,可以通过GitHub的Watch功能用邮件订阅项目的动态

3 个赞

:laughing:,我就不低头,
输入法有手写输入法吧(?居然没有)

居然发现了儿时学过十多年毛笔字的益处了,
我对字形都能记忆个七七八八!
去物书堂里写完看看是对的:crazy_face:

我记得自己开始学日语的时候国内的输入法对日文汉字的识别效果好像都比较糟糕,无奈之下为了MOJi的那个手写输入充了会员(可MOJi后来说要买VVIP才能用手写!!!所以借这个机会吐槽一下),后来发现Gboard的日语有手写,MOJi 的高级会员就用得不多了,不过听你的描述,iOS端的输入法是不支持手写吗?

不过自己会对这方面上心可能还是自己看国内出版的描述日本风土人情的书,查单词留下了太多心理阴影。再加上看到周围考研的同学背MTI的百科词条,查其中的人名搞得焦头烂额,这才诈尸式地更新一下(主要还是想蹭下热度,多骗几个人来做测试)233

2 个赞

iOS日语键盘啊

  • Japanese- Kana
  • Japanese- Romaji
2 个赞

2022-10-16

  1. 补充大量平假名词条(即不限于拟声拟态词)
  2. 支持沸きたつわき立つ等异形词及其活用,提供沸き立つわきたつ2种跳转链接
    1. 使用日国研提供的複合動詞レキシコン数据,共计2759个动词(其中五段复合动词1821个,一段复合动词936个,还有2个数え切れない煮え切らない一般以惯用表达的形式出现,且不以动词规律活用已剔除),如果有补充的话,欢迎到项目的地址提交issue,或者通过 [email protected]
  3. 重构项目代码,自动化打包流程
  4. 新增对一段动词的使役态口语约音食べせる的支持,划食べせ可以提供跳转链接
  5. 删除品词分类错误的动词伏せる

下载方式:
论坛网盘:https://cloud.freemdict.com/index.php/s/Q62m2gk2dT5Lm99 30 5
蓝奏云:https://wwp.lanzouf.com/b011tnz6b 3 密码:8yp8

3 个赞

这个vv-lexion挺不错的,甚至还有中文释义、例句和例句译文。非常适合下回来背一遍。虽然大部分复合词很容易猜出意思,但也有少数的引申义需要想一想。而这些复合词普通词典里经常不收,一般的词表里也不会有。
以防有人找不到,贴一下链接
https://vvlexicon.ninjal.ac.jp/xlsx/vv-lexicon.20181018.xlsx

感觉挺适合转成mdx的,感谢分享

v3版本也会跟进支持复合动词的优化,完成后就会用Mecab进行验证,希望能有个过得去的准确率:)

7 个赞

给大家拜个早年233:)

8 个赞

楼主新年快乐啊,日期是不是应该是2023.01.21呢 :joy:

帖子写错了233,不过好在上传的文件没有搞错

1 个赞

604458->1004008????
太恐怖了。。。
强烈支持一下!!!

主要是IPAdic、JUMAN和UniDic形態素解析辞典的制作人员的功劳,真要我收集,不知道要鸽到哪天233

发现 2023-01-21版本的词条数并不是1004008,而是66万。请问是词条合并了,还是传错文件了呢

我这边检查了3个链接,都没有传错呀233,可以提供下词典软件的词典详情界面么?

66万->604458:有些小的改动和修改没来论坛通知:),比如:之前发的mdx文件名少打了一个n,已经修改为“NonJishoKei”了,可以把原来的那个叫做NoJishoKei的mdx删掉

1 个赞