这个帖子的标题还是没有写太好,不过大致的意思差不多吧。
我估计很多人都会和我一样,在刚开始接触词典论坛的时候会有的兴奋,然后渐渐的就意识到其实自己并不需要那么多的数据/书籍/词典,反而更需要将一份高质量的数据好好利用而使得语言学习真的卓有成效。
词典其实是个很精华的东西,很多词典都是是经过千百年的沉淀加之于专家们的整理而形成的知识数据库。于我而已,词典远不仅仅只是键值对,而更多是一份语言的数据库。
将一份词典数据,充分利用,不说力大无穷,也能相当给力。
抛砖引玉,我来谈谈我是如何用我手里的词典/或者类似词典的数据的吧,也希望通过交流知道更多更好的使用方法:
-
通过分析词典数据,发现语言词汇背后的规律,见样例 https://blog.johannhuang.com/English/Data-and-Algorithms/20200502i
不过这仅仅是一份样例,是未完成的版本,通过简单的统计,比如可以知道德语里面 及物动词和不及物动词的大致比例 2:1 ,所以下次蒙是否及物的时候先蒙 及物。
-
汉英词典,通过合理的数据处理,可以生成 汉语同义词(且按英语释义分组的)词典,也可以做英语同义词(按汉语释义分组的)词典,见样例 https://dictionaries.johannhuang.com/cedict/ - 同样也仅仅是一份未完成的样例,其实更多也是想启发大家和我意义把词典数据用起来吧。
也就是
01 东西 - east and west - 东西、东西方
02 东西 - thing - 事、事情、事物、代志、…
03 东西 - stuff - 料、材料、东西、物事
04 东西 - person - 人、人士、人物、人身、… -
词典数据作为Anki卡片制卡填充 释义的来源,这样是的 记忆卡片的内容丰富,示例如下。
工具嘛 - 用Anki结合mdx的人都知道,有个FastWordQuery。
-
单词 简明释义 加 lrc歌词文件做自动滚屏播放器,被动学习,示例如下。
数据来源嘛,可以是很多本身就带有音频文件的词典数据。不过将数据提取出来并把相关的文本和音频匹配上且把文本做成lrc还是的花点功夫的。
以上是我的一些关于使用词典数据的想法,各位坛友如何看待?