Anki 牛津5000词

uuoo · 2025 年12 月 20 日 15:32

词表来源
离线保存 Oxford 3000/5000 官方网页，解析生成 oxford_uk_wordlist.tsv，包含词形、CEFR 等级，仅作为词汇范围与分级依据。

主词典来源（权威）
使用本地 OALD（oald.mdx），通过 mdict-utils 解包为 oald.db 及音频资源；数据库结构为
mdx(entry, paraphrase)，其中 paraphrase 为完整 HTML（释义、词性、例句、音标、音频引用）。

补充词典来源（仅兜底）
使用 Longman 6（long6.mdx → long6.db），只在 OALD 缺失例句时补充，不覆盖定义、不影响主数据。

提取与筛选流程
仅处理 存在于 Oxford 5000 的词条，只保留 UK 发音与 UK 例句；每词生成 1 张卡片，选择最常用词性，中文释义按词性整理，最多保留 2 个核心义项。

例句策略（严格）
每词最多 2 条例句：
优先 OALD → 若缺失则使用 long6；
需通过质量过滤（短句优先、无怪符号、非标题体、必须有音频），否则放弃。

音频处理策略
复制 UK 单词音频与 UK 例句音频到 Anki collection.media；
保留原始字段，同时新增 ukWordAudio / exAudio1 / exAudio2 仅用于播放控制。

Anki 模板设计原则

标签与结构
仅保留必要标签：CEFR_A1–C2、no_example；
牌组结构为 Oxford 5000::A1 … C1，不引入功能性牌组与冗余标签。

这周刚开始使用anki 之前并不了解所以结合chatgpt 好帮手！！！做出来的牌组导出后分享一下如果有哪些问题欢迎提出~

百度网盘对我来说并不友好

Hannibal · 2025 年12 月 20 日 16:34

挺好，虽然我用不到英语牌组了，但还是支持一下。

不过根据我的经验，这种多个意项一张卡的模式不算好，一个意项一张卡一两个例句可能更好。

尤其是一些get, do之类的词，把意项独立分开更好。

uuoo · 2025 年12 月 20 日 16:56

这样记忆起来应该会更平滑，感谢提醒！