求提取vocabulary.com的word family和韦氏红色词典的synonym

厚着脸皮求论坛的朋友们帮忙提取一下vocabulary.com的word family部分,和韦氏红色词典的synonym部分,其他内容都不要。之所以提取这两个是因为,vocabulary词典最有用的就是word family,目前还没有看到其他词典的word family更全面,entry更多,当然也有可能是我不知道,如果有的话,欢迎大家介绍啊。然后韦氏红色词典的synonym比牛津的更精简,比较方便记忆。

1.vocabulary.com文件
Vocabulary.com Dictionary.mdd (2.5 MB)
Vocabulary.com Dictionary.css (8.7 KB)

2.韦氏红色
The Merriam-Webster Dictionary.css (6.2 KB)
The Merriam-Webster Dictionary.mdd (19.7 MB)
The Merriam-Webster Dictionary.mdx (24.1 MB)
The Merriam-Webster Dictionary

1 个赞

word family的定义是什么呢?

在我这里,word family 和 synonym是两大类:

image

3 个赞

刚刚用2020数据做了一遍,词条数和前辈是一样的!用EmEditor+Regex直接提取的,不知道做法是否一样。
mdd是其他的图片、音频、样式等数据,这怎么提取出词条数据了。

voc_family.zip (3.7 MB)

7 个赞

VCOM 的 Word Family 数据(含词频)似乎来自 WordNet,质量一般:

You'll encounter the word Obama about once every 22 pages.
1 个赞

由义出发

  1. 同义作为该词的扩词中介
  2. 同背景、环境、领域、目的作为该词的的扩词中介
  3. 关联搭配词、模式作为该词的扩词中介
  4. 同词根、同义的不同词性的衍生词, knowledge → know, knowledgeable
  5. 同词根、同形的不同词
  6. 同词根、不同形的不同词的衍生词, knowledge → know ->k + now → cog + n → cogn → cognition
  7. 文化依赖的:德国:Germany(外邦人,相对罗马)Deutschland(部落,日尔曼,相对自身)

哪些好记,哪些除非除非兴趣否则不用这个组合法记很私人相对主观化,仅作记录,日后备用,还没想到什么时候做这个。

2 个赞