只要词组中的单词仍在词频表2万内,就有可能碰见。比如 keep……in check, worked up(激动的), pore over……;有些一般不需要刻意记忆如personal assistant, alarm clock等这些名词。
词频表和lemma,word family的问题目前处理的不是太好,有些看似进行时,过去时的词汇短语有其他常用意思,词频表中连字符的词有的需要注意,有时却只充当了一个占位符
我自己扒开词典做了一些anki词组,目前够用了,大概是2,3万级别,从朗文5做的anki词组目前我删减修改内容到2万7千多,韦氏网络版去掉部分在朗文5中重复的,剔除名词类,未综合起来编辑的大概是1万9百多,加起来3万8千(仍有部分重复)。