英语词组怎么了解它是否常用呢?

  • 我平时使用 [the little dict] 了解遇到单词的频率,例如这个单词,我可以根据 RANK 很直观地了解到是否常见.一般会将20000左右的添加到我的 Anki 卡组.

  • 但是
    对于一个词组,在词典界面只显示 FREQ, 而且是超低的频率.这样我应当怎样确定这个词组是否需要记忆(我并不太想记忆一堆基本上碰不到的东西)?这里的词频是怎么计算的呢?如果也能换成 Rank 就好了.

希望各位友友们能提供自己的经验

高阶词典有收录的学习下就好。

这个词典有时不太准确,建议用别的词频比如caca

记词典有收的那些就好了。如果你对词组的使用频率感兴趣,就用 Google Books Ngram Viewer 查吧。比如动词 stumble,你想知道它后面最常接哪些介词,选定语料集之后,搜索 stumbled_VERB *_ADP 前十结果如下:

2021年 American English

stumbled_VERB into_ADP 0.0000576334%
stumbled_VERB upon_ADP 0.0000590223%
stumbled_VERB over_ADP 0.0000344911%
stumbled_VERB on_ADP 0.0000353317%
stumbled_VERB to_ADP 0.0000291420%
stumbled_VERB across_ADP 0.0000288118%
stumbled_VERB onto_ADP 0.0000171242%
stumbled_VERB out_ADP 0.0000165014%
stumbled_VERB through_ADP 0.0000148397%
stumbled_VERB toward_ADP 0.0000095316%

考虑屈折变化,还能算出 stumble across 与 stumble 出现频率的比值约为 3.6%

2 个赞

谢谢推荐,我会去了解一下这个网站的使用方式

这个可以显示词组的 RANK 吗

好像不存在通用的词组频率表。Ngram 统计连续词序列的频率,却不知道哪些序列是“词组”。i love, and he 这样的高频序列,对语言学习毫无价值。

只要词组中的单词仍在词频表2万内,就有可能碰见。比如 keep……in check, worked up(激动的), pore over……;有些一般不需要刻意记忆如personal assistant, alarm clock等这些名词。

词频表和lemma,word family的问题目前处理的不是太好,有些看似进行时,过去时的词汇短语有其他常用意思,词频表中连字符的词有的需要注意,有时却只充当了一个占位符

我自己扒开词典做了一些anki词组,目前够用了,大概是2,3万级别,从朗文5做的anki词组目前我删减修改内容到2万7千多,韦氏网络版去掉部分在朗文5中重复的,剔除名词类,未综合起来编辑的大概是1万9百多,加起来3万8千(仍有部分重复)。

这两天想了想,我将我认为必须要知道的认识的词组进行搜索,查看它们最低的 Freq, 最低大概100. 于是定下一个标准:大于 100 频率的都加入 anki 卡组.