教育部《普通高中课程标准2020修订》英语词汇表增补版20241120

制作大体如下:

  1. 文字数据处理
    文字数据来源官方3000词汇表和网络上下载的高考英语真题试卷。其中试卷doc格式需转成txt格式,方便处理。
    处理软件不要用《微软word》或《wps文字》,因查找速度慢甚至会崩溃。
    软件可用《WPS表格》和EmEditor。只用EmEditor也可,但没学会,没有经验。
    WPS表格用于导入官方3000词汇表纯英文单词然后增补词性、词义等部分以及增添音频和图片的语句。
    EmEditor用于增补词汇和例句的提选,搜索单词,再选例句。
    所下载的真题doc文档错误颇多(近两三年有的例外),需一边提选,一遍校对。
    校对非常费事费时,需要将文字版与图片版对照。无图片版的,又怀疑有问题的句子只能放弃。
  2. 音频数据处理
    音频数据大部分来源中学教材。
    软件可用GoldWave、Adobe Audition和Balabolka。
    (其实GoldWave、Adobe Audition用一个即可。但觉得哪个功能好用、易学、易记就用了哪个)
    GoldWave用于将音频分割成一个个的单词。
    Adobe Audition用于调整音量。
    Balabolka用于文字单词转换成音频单词(因为少数单词派生词,即使是朗文或牛津等也没有其读音音频)。
  3. 图片数据处理
    词形谱文字处理可用《WPS表格》然后用截屏软件如HprSnap抓取成图。
  4. 数据转换成mdx
    用工具软件ExcelToTxtP将处理好的表格文档转换成*.txt格式的文档;
    用记事本或其它文本编辑软件将txt的编码转存为UTF-8;
    转换后的txt文字颜色全部为黑色,可用EmEditor查找替换成你所需要的文字颜色同时可调整显示行数的格式;
    用软件MdxBuilder将处理好的txt打包成mdx字典。
    因只会照葫芦画瓢,很多地方都没弄懂,入门都谈不上,所以文本处理未完全到位,表格处理也是用的笨办法,css也没时间学,以上仅供参考。
    做这本字典完全是看中了这个网站,可以无门槛地学点东西,其它的不会考虑。
3 Likes

人力太辛苦了吧,佩服。不过我认为例句并没有那么重要,高中生先快速脸熟必背单词,后面会有足量的练习去巩固。词典后附带大量例句看的人应该不会太多,而且高考例句对比词典例句也没有太大的优势。

不背单词app对历年真题的处理我觉得很好。先进行语义分析,高亮出现过的语义,点击可以查看相关例句。

我感觉例句很有意义,拿着词典背很快就回忘记,只有放到句子中才能记得牢,高考例句应该算是比较经典吧

1 Like

太有毅力了,真是感谢您

谢谢指点。文本处理本身就是件需要技能并消耗时间和精力的活儿,目前只能做到这种程度,能否做完还要看时间和精力。mdx的门槛还没有迈过,更不用说做到《不背单词app》的亮点了。但如果有《不背单词app》的mdx的源码,一定会学习并用之。

2 Likes

其实我也不懂。
祝早日完工,技术更上一层楼

楼主您好,更新后及时上传分享一下呗。我感觉里面的例句很有用

good job!

1 Like

楼主辛苦了,谢谢分享

百度网盘挂了,谁再分享下

楼主,再传一下更新呗,谢谢啦

1 Like

求再分享一次,谢谢

1 Like

我这里有2007-2017年的高考真题,里面还有翻译和详细解释,你有兴趣做吗?

1 Like

感兴趣,应该可以借鉴。

历年高考真题解析.rar 2007-2017年高考真题里面还有听力录音,这也是切书扫描的,高清,可以直接OCR。
链接:百度网盘 请输入提取码
提取码:f2m4

2 Likes

非常感谢!正在下载。有时间和精力时再OCR

1 Like

你好, 能再分享一下链接吗, 对这种专门针对某个词表做的词典很感兴趣~

[quote=“Wang, post:40, topic:4407”]
f2m4
[/quote]可以分享一下吗?作者的挂了

2 Likes

感谢楼主持续更新

1 Like

哈哈,催更来了