British National Corpus (BNC) - English Corpora

希望有人把它转成MDX
In the hope of having it converted to MDX

https://pan.baidu.com/s/118abaS5Zo-2gnJ56FT2DDA
password: 1a7o
Un-zip Passcode: the_BNC

Origin:
https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/2551
https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/2552
https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/2553
https://ota.bodleian.ox.ac.uk/repository/xmlui/handle/20.500.12024/2554

2 个赞

最好有点简介。。。

英语国家语料库(British National Corpus,简称BNC)是目前网络可直接使用的最大的语料库,它是英国牛津出版社﹑朗文出版公司﹑钱伯斯—哈洛普出版公司﹑牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立的大型语料库,于1994年完成。

英国国家语料库(BNC)是一个以来源广泛的书面语言和口语为样本,收录了1亿字的电子资源,用以呈现20世纪后期以来的英式英语,涉及口语和书面英语。该语料库书面语与口语并存,词容量超过一亿,由4124篇代表广泛的现代英式英语文本构成。其中书面语占90%,口语占10%。BNC最新版是BNC XML 2007。它采用国际通用标准化标注体系SGML,使用三级赋码标注,使标注错误率由3%减少到1%。在应用方面,该语料库既可用其配套的SARA检索软件,也可支持多种通用检索软件,并可直接进行在线检索。

1 个赞

本身不是词典,也没有词头,做成词典查什么?干嘛不直接使用语料库检索工具?

是啊。
BNC是免费开放的语料库,并非词典资源,好像没有必要弄成词典。
难不成是做成索引?