日语词频词典NLT mdx

NLB、NLT皆采用同一套语料库搜寻系统,即日本国立国语研究所(国立国語研究所,National Institute for Japanese Language and Linguistics:NINJAL)和Lago语言研究所(Lago言語研究所)共同开发的语料库搜寻系统「NINJAL-LWP(NINJAL-LagoWordProfiler)」。

NLB全名為「NINJAL-LWP for BCCWJ」,数据基於日本国立国语研究所建构的「现代日语书面语均衡语料库(現代日本語書き言葉均衡コーパス,Balanced Corpus of Contemporary Written Japanese:BCCWJ)」,总语汇量约1亿笔,其资料来源几乎皆本於书籍(如教科书、畅销书、雑志、法律、国会会议録……),风格或许较近书面文字。

NLT全名為「NINJAL-LWP for TWC」,数据基於「筑波网路语料库(筑波ウェブコーパス,Tsukuba Web Corpus: TWC)」,总语汇量约11亿笔,其资料来源则是从诸多日语网站收集而来,风格或许较近日常语言。

聊备数语,由衷感谢楼主的制作。

6 个赞