想找COCA Frequency 60,000,找到下载,求前辈看看是否比较新和比较准确?

一, 本来是想找一份英语单词词表COCA Frequency 60,000,
最好是excel格式的,只需要最少的2列数据,一列是单词,一列是序号或使用次数或频率即可.找到了好几个可以下载的,求熟悉这东西的前辈看一眼,哪个是准确的,且最新的.
用来刷一刷词汇,倒也不必非得最新的,比较准确即可.

二,问了一下AI关于历史和最新版本.
Grox说最新是2020年的,"2020 年 3 月发布重大更新(COCA 2020)"而felo说是2024年,“最新的更新版本为2024年1月,包含了最新的词频数据和统计信息”.

三,几个可以下载的地址,
其中,这2个似乎是相同的。
1,COCA语料库下载(带音频) - wzhone

2,COCA frequency list of 60000 words - DOKUMEN.PUB

另外,本论坛的cloud也有2个coca 6000的mdx,
不知道是基于哪个词表,

请熟悉的前辈指点。
多谢!

coca60000都是一样的

COCA60000,应该都是一样的。

坛里好像没有现成的excel;PDF只有COCA60000整理删减之后的39849版本:COCA60000-39849 背诵版

最近我把COCA-39849放到SII精工电子词典里面了,感觉挺好 :slightly_smiling_face:电脑上的PASORAMA也能用

个人建议 BNC/COCA lists BNC/COCA lists ( 25k lemma family + 中英分级 ) - 英英 - FreeMdict Forum

公开的coca没有word family,而且还有近1W的组合词

以下这种,就没必要背

看COCA官网的语料你会发现没有19年以后的
词频准不准,找个词去官网查查就知道了

1 个赞

上周问题已经解决,回复一下,感谢各位。
其实也简单。
1.找一份coca60000.
在1楼我列的网址可以下载coca 60000,看着不太像2016那个流传版本,不确定是2020还是2024,反正比较新。
2,手头有恶魔奶爸的经济学人2w(这个准确的是20020个),这个曾经刷过,很实用。有longman 9000,有gre 8000,不知道来源。就从coca6w截取前3w,与longman9k,gre8k,都合并到一起,再去重,因为coaca 6w里面有同一个单词不同词性的。最后得到2万8千。
3,切掉前1w。就得到18k个单词,看了一下,质量还不错。
4,有点麻烦的是,这些单词全部是大写。比如ABYSS之类。实在不能忍受,要转小写,又不能用excel的函数一刀切,想找AI处理一下,从grok找到NotebookLM,都不能直接提供处理结果的下载,最后豆包解决了。
5,最终,得到18k个单词的一列。这就是之后一段时间刷单词的目标了。
至於词频,不需要考虑,只要是前3w内的,一视同仁,全背下来。不管它词频是多少。

前辈您好,请问可以请求获得一份恶魔奶爸的经济学人2w表格吗,发现目前的网上似乎很难搜索到这个了,恶魔奶爸本人好像也已经注销账号了,十分感谢 :folded_hands:

给你搞了一个新帖
回复在那里

1 个赞