membrane这词在技术领域出现得较多,iWeb采集全网络词频可能就高。做过几个电池领域的案子经常看到,倒不是英文,是日文的片假名
词频也只能做参考,不同领域词频差别极大,全范围语料库看起来似乎更权威,但对于分属领域就未必很适用。我最近刚开始看哈利波特第一册,按理说总词汇数也就4400应该简单得不行吧,实际上一大堆词频在1万5甚至2万后的词,而且还都是字母数7以内的所谓“小词”。我感觉词频采集范围越广(例如iWeb这种全网络采集的),对于文学作品的词频可能就不准。
1 个赞