谁有最新的 (2021)的《现代汉语常用词表 (第2版)》吗

这本书,2008年出过一版草案,虽然语料库主要(一半以上)来自人民日报,词频难以客观反应总体的情况,但是重点在于他的分词选取和总体高频数量的把握还是较有参考价值的吧

2008 版的很容易找到,但是毕竟是草案,还是有些瑕疵的,但最新的2021版的我这里的图书馆只能闭架阅读,些许麻烦,单独买一本似乎又没有必要,就一个单纯的词表而已,售价130米左右

所以,不知各位谁有现成的,能否分享一下呢

可以考虑下载国家规范《通用规范汉字表》,共8105常用字,分三级。

1 个赞

同意二楼的看法。顺便这里给个链接:

1 个赞

国家规范的字表挺好,但跟词表的作用还是有明显区别的
比如中文词表就明显有一个分词的问题——哪些字的组合算作一个词
常用的当然不必说,但一些次常用,和不常用的,要怎么才算做是一个词,也是要有一个基本的共识的
所以我觉的《现代汉语常用词表》的一个较大作用就是对那些字的组合算作一个词的研究和确认
所以才希望能有一个这样比较权威的词表

1 个赞

噢,我看岔了,没注意是“词表”。

说到词表,我首先想到了教育部语言文字应用研究所有个官网,叫做“语料库在线”,但它这几个月一直在维护,目前打不开了。我依稀记得里面提供了几个字表、词表,不过好像也是零几年发布的,数据不是很新。

另外我还有个建议,就是可以去查普通话水平测试的词表,这个比起那个人民日报作为词库的词表,我个人认为应该是更偏日常的。不过这个网上数据很杂,我之前在Gitee上看到过一个很全的,但现在它搞了审核制,我也找不到了

还想到了一个:可以下载坛友分享的现代汉语词典的MDX,解包出来,然后把词头单独导出一个文件,再用正则或其他程序把单字为一行的都删掉。那么剩下的自然就都是词语、熟语了,熟语应该不多,所以可以近似认为剩下的这个文件它也是个“词表”了。

1 个赞

确实,可以把几个中文词典的词头综合整理一下,也算是一个词表了
可惜的是这些大部头词典无法反应当下时代的语言变化脉络

1 个赞