日本語非辞書形辞典_v1

感谢分享 :blush:(之前一直没有注意还有这个地方 :rofl:

@First_Last 提供的日语构词法词库着实很强,我再试试看更复杂的活用

建议试试使被态(怒らせられる)、口语(怒っちゃダメ),或者多重嵌套(怒らせなければ)
嘿嘿嘿

只有使役被动态可以,这就是黏着语的魅力吗(指头轻脚重) :joy:

变形规则在 ja_JP.aff 这个文件里

楼主很有钻研精神 :bingdundun:

1 个赞

反馈个问题,不知道楼主能不能改
如果查的词作为相同的词头重复出现过几次,在词典中就会显示几次辞书型,有时候就会占据大量版面,能否修改为只显示一次?

参考,不知道有没有帮助?

有的,有的,感谢测试和建议哈(我制作时没有仔细琢磨,做好之后才意识到这个问题,但是不太确定是哪几个部分导致了重复词头,就没管这个问题)

1 个赞

谢谢夸奖呀,其实最后真的会动手,还是看到了您的这篇帖子 新世纪日汉双解大辞典 词头修复 经验分享,意识到这方面的经验是有一定价值的

哈哈哈,是的呢
感谢指点,我看电脑对这个格式的文件图标支持有点问题,还以为要用什么特殊的软件打开,还想着要不要去看看GoldenDict对这个构词法功能的的说明文档
另外,这位兄弟 @First_Last 提供的构词法词库确实很强,我注意到他似乎有意识地想解决动词多重变形,值得细细琢磨一番

请问gd哪里可以看到是Qt5WebKit 版本还是Qt5WebEngine版?
我的不能用

哪里可以下Qt5WebEngine?

本论坛就有呀。

楼主,非常感谢!这对查询十分有帮助。实际上好像Weblio上有一完整的变形查询字典,我一下子没找到。

1 个赞

这两个帖子里都可以下载

1 个赞

感谢,你这么一提醒我也有点印象,我试了一下也没找到……

谢谢~

看换了内核,考虑下是否换gd

之前打算搞这个活用形辞書,但反爬有点烦人,自己也不学日语,结果半途而废。

给个URL列表供大家参考吧,若哪位抓取、制作了,可以分享下。

weblio.txt.gz (2.6 MB)

2 个赞

这不是我做的。
只是看了你的帖子,
觉得应该有强者做过,
果然有找到。

昨天还有看到两个相关的 Morphological Analyzer
有兴趣可以研究一下。

http://taku910.github.io/mecab/

1 个赞

请求间加个延迟就行了
我昨天加了1.3s的random延迟爬《精選版 日本国語大辞典》到现在没被ban,但才爬了 1w看错 10w条,目测还得2天
但不知道最小值在哪
被ban下等好久,不太好试

刚刚发现weblio上的这本突然消失了,不会是我爬的原因吧 ,这下只剩kotobank有了

1 个赞

很有启发,非常感谢!

1 个赞

还是十分感谢!!!之前只能笨笨地用Google机翻给的conjugate这个单词到处找相关研究,实在后悔没继续坚持学英语