【新人词典试水作】Dark Green Slash Series

之前在 有什么好的词典制作教程吗? 的问答,发现应该直接上手制作一次。由于有一些编程基础,所以很快就跑完了完整的制作流程,成品发出来供大家批评指正。

上传到了论坛的云盘(应该是?): Dark Green Slash Series - FreeMdict Cloud

作者有强迫症,所以给词典设计了很简单的 logo 以方便在使用时识别正确的词典。logo 里使用了墨绿色的 / 元素,所以姑且将这个系列命名为 Dark Green Slash Series,之后会持续更新自己制作的词典(希望有时间

当前制作/修改了两份词典。

FreqDict

个人向,从头构建的比较精简的词频/词表词典。之前尝试过很多词频词典但都不太满意。主要是因为所含的要素太杂,且数据源不清晰。基于个人的需求重制了。在排版上,由于我习惯于将这一类功能词典放在最顶端方便快速判断词汇的重要性,所以排版尽量压缩了纵向空间,以确保不会把后面的词典挤到很下部。同时很多词典习惯使用品牌标志区别不同的来源,但由于我不是很熟悉很多源的图标,经常会忘记,所以也进行了个性化调整,直接保留了全称。

涵盖了多种权威的数据源,下面截图是词典的描述页:

FreqDict 词典的描述页截图

The BNC-COCA Lists

词频词典: The BNC-COCA Lists 进行了调整,感谢原作者提供的数据等。修改如下:

  • 修改版本涵盖了全部35个 BNC/COCA Lists
  • 对数据呈现进行了修改,将词语出现的频率从绝对数值改为了百分比,这样能够更容易的看出不同的词形使用的频率
  • 将排版改为了三列(一样的逻辑,节约纵向空间)。同时进行了自定义适配,当屏幕宽度过窄时,会自动转为两列或者一列

One More Thing

最后,两本词典在以下环境下已经测试,未见明显问题:

  • GoldenDict-ng,win11
  • MDict, Android

欢迎各位朋友提出使用体验和意见 :smiley:

感觉词汇量有点少了,coca有6万词频,不知道其他几个有多少。现在只有2万多,高阶学习者几乎都要学习。

coca 当前只取了前2w,词典总词量大概2w多(各大词表词频还是有很多重复的)。

制作时候也有所取舍,开始确实想使用coca-6w,但数据源没有找到很好的(也没有太花时间去找不过lol),如果有可靠的数据源可以指路一下 :grinning_face: 。不过制作的时候也是暂时不追求大而全,而是关注高频。因为题主在海外留学,根据自身情况,感觉背太多的词汇其实不现实(时间有限+重复频率低容易忘记),现在更多转向日常高频+专业词汇刻意学习的路线了。

刚试了,好用!

COCA Frequency 60000.zip (2.1 MB)
这个Coca 60000数据是对的。

感谢!我刚刚查看了一下,求教一下这个数据应该怎么解读呢,是只看第一行的结果吗。每一行的数字是什么含义呢


词性后面那个是排序。