这里写得确实有点随意了,略去了一些关键的上下文信息。
单词的统计本身是一个复杂的命题,不同的统计单元、面向不同的用途都会得到不同的结果。此处的 5 万来自对词典「Webster’s Third New International Dictionary」的统计,这本拥有超过 45 万个条目的词典,包含 5.4 万个词族 (不包含复合词、专有名词、一些地方方言等) [Goulden,
Nation, & Read, 1990]。这是一个相对有些过时的研究,毕竟语言本身的发展是动态的,但这里不再深究,因为 5 万已经是一个难以达成的上界。
(原文此处已做适当调整)