【历史讨论】GoldenDict-ng 基于Qt5.15.2/Qt6.X版本

(删了也没用,我已经通过邮件存档啦)

您推荐的那个工具应该是用于分析文章,划词应该不是他们设计这个工具的初衷,二者还是有一定的区别(比如划词的时候,上下文语境基本丢失;又比如,划词的文本没有经过清洗,需要专门预处理)。

不过我们可以参考他们的处理细节,进行一定的修改(分词什么的就不用管了,我们只需要关注分词之后的推导过程即可)

下面是我搞了一半的笔记,给大家一点思路(非计算机科班,只懂Python皮毛,大家不要被我误导了哈):

他们提供其他语言的源码,这里(只能慢慢往下滑,搜不了是怎么回事……)

但下载之后发现文件未免太小了

3个Python文件就可以实现日语的NLP了吗233,应该还是要调用打包好的 exe(但我是要研究处理细节啊,不可能去读二进制代码吧)……另外使用的是python2的语法……

所以就没往下研究了。

又不死心找了一个:
SamuraiT/mecab-python3: mecab-python. you can find original version here //taku910.github.io/mecab/

非官方接口,虽然提供了Python接口,但实际处理过程也(应该)不是Python