恳请高手转化一个颇具特色的词典:「中文詞彙網路」( Chinese Wordnet, CWN)

这个词典颇具特色,官方提供多种格式的源文件下载。

官方介绍:

下载地址:

https://lope.linguistics.ntu.edu.tw/cwn/download/
(有mdb和sqlite等格式下载)

哪位达人能转换成dsl或mdx词典吗?能顺便转换成excel表格或csv吗?这样方便我等小白们二次利用?

词典截图:




以上截图取自 [ 中文詞彙網路手冊:理論與使用說明] https://lope.linguistics.ntu.edu.tw/cwn/documentation/handbook.rar

在线查询页:中文詞彙網路 | Chinese Wordnet

谢谢!

3 个赞

“汉汉”的分类是发词典用的。这类帖子的分类是“资源求助”。

mdb可以用Microsoft Access打开,导出为Excel档案。

2 个赞

这个很早做过,做了也没怎么用。有空看看扔哪儿了

1 个赞

期待楼主能找到…… :smile:

1 个赞

谢谢提醒,我把帖子移到“资源求助”分类了。
能力有限,用不了Access,望洋兴叹。谢谢!

https://www.123pan.com/s/iFRRVv-jPWQ3
找到了,但因为历时久远,也搞不清楚到底是不是我做的了。但发现一些问题,同词头没有合并,没有简体索引。不想弄了,有兴趣完善的可以继续。

1 个赞

非常谢谢sxingbai分享资源!这是相当好的词典。主编黄居仁为康乃尔大学语言学博士,现任职於香港理工大学,这是他担任台湾中研院语言学研究所研究员时所主持的计画;其词义的标注、释义的解析,对於现代汉语语法的学习都很有帮助。楼主发的网站是第二版,这版本资源为第一版,第一版网址如下:
https://cwn.ling.sinica.edu.tw/

做了些简单的修订如下:

  1. 「叙」显示为乱码「?」,此为原网站即有的问题,今修改为「叙」。
  2. 多义项词条的跳转顺序未一致,如「一」义项顺序为2134、「京」为54321,今修改为如12345的顺序。
  3. 多义项词条若数字为全形者(如「癸1」),原跳转有问题,今已修正。
  4. 义项达10以上的词条(如「阿」、「巴」、「漢」),顺序原1後接10、11而非2,今修改为如123…9、10、11的顺序,这也有助於词条跳转顺序的排列。
  5. 细部标签问题,如「瘋狂」、「叙1」等处,一并修正。
  6. 参考原网站,於「共有n个词义」前加上词头。

修订版如下:
中文词汇网路_20220906.mdx (9.1 MB)

再次感谢sxingbai的分享 : )

3 个赞

好速度,好身手!

1 个赞

你这个下载地址,我无论用Firefox或Chrome打开,都会看到警告,说可能不安全。

假如你把mdb版上载到本坛,我可以看一下,看是否能转换成Excel档案。

我个人不需要这个东西。

感谢各位的热心和分享!
mdb文件上传到这里如下:
cwn_sqllite3.mdb.7z (18,2 MB)
mdb原下载直链:
https://140.112.147.120/cwn/CWN_DB/sqllite.data/cwn_sqllite3.mdb

感谢分享旧版词网,期待新版早日做成。

我看了一下这个mdb,有46个table,16个query,只有1个form。

这是机械地从sqllite转过来的,在Access里无法直接用,除非重新组织调用那些table的数据。

假如机械地把table转为Excel,除非重新组织,要不然还是用不起来。