谁愿意帮我爬一遍 WordReference

nlmha · 2021 年5 月 30 日 09:53

文件行数一致

nlmha · 2021 年5 月 30 日 10:07

比较时发现足本有一大堆空的词条，原版有词性可以看（虽然用处不大）
eg misorder, self-concern, unfoolable, quasi-faithful

顺道问问为什么没有爬网站的 headerWord。我看 extract.py 是从词典里的“词头"再处理生成词头，不会更容易犯错吗？

lurker · 2021 年5 月 30 日 10:37

headerWord 是三本词典的词头，我起初直接用它，导致了很多错误。所以我重新提取了词头，顺便提取了词组。