关于 FF 两部词典(ODE & Collins COBUILD)的词频统计

相比COCA等数字词频,我认为 fearfare090807 提取自 Oxford English Dictionary 的●●●●●●●● 词频和 Collins COBUILD 自带的 ★★★★★ 词频更为直观。

但苦于不知道两个词典的各个层级所对应的具体单词数,因此,我前一段时间用 MdxExport 把 fearfare090807 的两部词典解包开,做了个统计,统计结果如下 :point_down:

﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌
01.Oxford Dictionary of English
ps:
① 〖〗内为各层级(●●●●●●●● )的例词以及简要文字介绍;
② 该统计未包含最近补充的7000多新词。

7.06%

〖one, over, apple 日常语言〗
●●●●●●●● 77 (1~77)
●●●●●●●○ 861 (78~938)
●●●●●●○○ 4495 (939~5433)

〖incapable 主要为受过教育的相关词汇,与 Bands 6-8 中的日常语言有明显偏离〗
●●●●●○○○ 13349 (5434~18782)

9.75%

〖forgettable 经常在小说、新闻中使用〗
●●●●○○○○ 25938 (18783~44720)

33.01%

〖tête-à-tête 虽然在小说、报纸中不是太常见,但也没有很生僻〗
●●●○○○○○ 32534 (44721~77254)

〖thingamabob 专有名词〗
●●○○○○○○ 46184 (77255~123438)

〖a la carte 极少使用〗
●○○○○○○○ 9096(123439~132534)

50.18%

〖China blue〗
○○○○○○○○ 133488 (132535 ~266022)

﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌﹌

02.Collins COBUILD

49.59%
★★★★★ 877 (1~877)
★★★★☆ 2479(878~3356)
★★★☆☆ 6496(3357~9852)
★★☆☆☆ 12679(9853~22531)

20.53%
★☆☆☆☆ 9326(22532~31857)

29.88%
☆☆☆☆☆ 13578 (31858~45435)

8 个赞

放到此分类即可

image

可否说一下您是用什么软件来做这个统计的?

2 个赞

Notepad++

2 个赞

可否说一下Notepad++统计的方式?

其实很简单,用 MdxExport (该软件在掌上百科网站下载)把对应的 mdx 文件转成 txt 文件,Notepad++ 是专门用来打开这类 txt 文件的,至于统计就是用【查找】功能对各个词频层级分别进行【全局查找】,类似于 Word 的【查找】。