什么软件可以输入英语文章文本后提取出单词表?

考虑到单词有很多形变,如过去式,过去分词,现在分词,希望提取出它们的原型生成一份单词表。还要过滤掉标点数字等不属于英语单词的文本。技术关键点在于找到一份形变词表大全,据说这种词表叫做lemma ?

自己想写个程序,但是怀疑早有类似软件了,重复造轮子不可取。最好是提供编程API可以用自己的程序调用生成文章词表,因为生成文章的词表后还希望用程序和现有其他词表(如如4级单词表,6级单词表,8级单词表,TOEFL单词表,SAT单词表)进行交并差等集合操作得到新的词表用于背诵记忆。

skywind3000/ECDICT: Free English to Chinese Dictionary Database (github.com)

3 Likes