文件行数一致
比较时发现足本有一大堆空的词条,原版有词性可以看(虽然用处不大)
eg misorder, self-concern, unfoolable, quasi-faithful
顺道问问为什么没有爬网站的 headerWord。我看 extract.py 是从词典里的“词头"再处理生成词头,不会更容易犯错吗?
headerWord 是三本词典的词头,我起初直接用它,导致了很多错误。所以我重新提取了词头,顺便提取了词组。
1 个赞