新华字典 21003 字头分类统计（非 OCR，来自 swg_xhzd.dict.adgz）

口径说明：
1. “正文主链/正体字头”：CSV 中 kind=main，即词库 prev/next 正文链。
2. “异体/繁体/并列形”：CSV 中 kind=variant_or_parallel，即与主链字头共用同一 prev/next 位置、在括号里挂接的字。
3. “剩余/补充”：CSV 中 kind=extra_not_attached_to_main_chain，即属于 21003 但无法挂回主链的记录。
4. 这是数据结构口径，不保证每个 variant_or_parallel 都能严格语言学区分为“繁体”或“异体”。

总计：
- 总记录数：13830
- 去重后总字数：12426
- 私有区 PUA 记录数：265
- 私有区 PUA 去重字数：253

按类别：
- 正文主链/正体字头（按词库 prev/next 主链）：9477 条；去重 8509 个；其中 PUA 220 条 / 去重 210 个；仅属于本类的去重字 8442 个
- 括号挂接字头（繁体/异体/并列形）：4323 条；去重 3959 个；其中 PUA 39 条 / 去重 37 个；仅属于本类的去重字 3895 个
- 补充/未挂接主链记录：30 条；去重 30 个；其中 PUA 6 条 / 去重 6 个；仅属于本类的去重字 17 个

类别重叠（按去重字）：
- 主链 ∩ 异体/繁体：59 个
- 主链 ∩ 补充：8 个：侗划呇括桲粳芥郎
- 异体/繁体 ∩ 补充：5 个：摺秔稉粇酖
- 三者都有：0 个

补充/未挂接 30 条：
- 秔 U+79D4：见gēng“粳”。
- 粇 U+7C87：见gēng“粳”。
- 稉 U+7A09：见gēng“粳”。
- 鉨 U+9268：见nǐ“”。
- 諲 U+8AF2：见yīn“𬤇”。
- 闉 U+95C9：见yīn“𬮱”。
-  U+E8C8：人造的放射性元素，符号Og，原子序数118。
- 桲 U+6872：用于地名。
- 粳 U+7CB3：见jīng。
-  U+E049：人造的放射性元素，符号Nh，原子序数113。
-  U+E8C6：人造的放射性元素，符号Ts，原子序数117。
- 𬤇 U+2C907：恭敬。
- 𬮱 U+2CBB1：瓮城，也指瓮城的门。
- 䎬 U+43AC：耙：用来把土块弄碎、弄平的农具。
- 䌷 U+4337：引出，缀辑。
- 酖 U+9156：同“耽”。
- 芥 U+82A5：芥菜（也作“盖菜”），是芥（jiè）菜的变种，叶大，表面多皱纹，可用作蔬菜。
- 㧏 U+39CF：扛：两手举东西。
- 括 U+62EC：（衣服、纸张等）较硬而平整。
- 划 U+5212：㓦：处置，安排。
- 㱮 U+3C6E：溃：疮溃（kuì）烂。
-  U+E1D4：皮肤上生来就有的深色斑。现多写作“记”。
- 硷 U+7877：碱：含有10个分子结晶水的碳酸钠，性滑，味涩。
- 郎 U+90CE：蜣螂（qiāngláng）的俗称。
- 呇 U+5447：明星。
- 侗 U+4F97：笼统：缺乏具体分析，不明确；含混。
-  U+E38C：恭敬。
-  U+E10C：瓮城，也指瓮城的门。
- 摺 U+647A：折：折断。
- 谘 U+8C18：咨：跟别人商议，询问（–询）。

PUA 前 80 个：
(U+E000) (U+E0E1) (U+E0EF) (U+E0F0) (U+E0FE) (U+E1E8) (U+E157) (U+E219) (U+E1ED) (U+E10A) (U+E01B) (U+E077) (U+E1EC) (U+E2E6) (U+E01C) (U+E185) (U+E02B) (U+E0FD) (U+E057) (U+E04A) (U+E072) (U+E073) (U+E0F1) (U+E02D) (U+E0C3) (U+E10D) (U+E1D3) (U+E1C6) (U+E047) (U+E04B) (U+E058) (U+E2CC) (U+E29D) (U+E167) (U+E117) (U+E124) (U+E138) (U+E1B8) (U+E0A7) (U+E01D) (U+E1F4) (U+E1F8) (U+E143) (U+E161) (U+E009) (U+E31F) (U+E08D) (U+E001) (U+E01E) (U+E169) (U+E103) (U+E1FC) (U+E800) (U+E10B) (U+E206) (U+E094) (U+E04C) (U+E20D) (U+E14F) (U+E152) (U+E217) (U+E01F) (U+E30A) (U+E311) (U+E037) (U+E153) (U+E31E) (U+E392) (U+E305) (U+E095) (U+E313) (U+E30C) (U+E002) (U+E0A8) (U+E104) (U+E31D) (U+E310) (U+E303) (U+E0D7) (U+E251)

JSON summary:
{
  "total_records": 13830,
  "total_unique_chars": 12426,
  "pua_record_count": 265,
  "pua_unique_count": 253,
  "pua_by_kind_records": {
    "main": 220,
    "variant_or_parallel": 39,
    "extra_not_attached_to_main_chain": 6
  },
  "pua_by_kind_unique": {
    "main": 210,
    "variant_or_parallel": 37,
    "extra_not_attached_to_main_chain": 6
  },
  "records_by_kind": {
    "main": 9477,
    "variant_or_parallel": 4323,
    "extra_not_attached_to_main_chain": 30
  },
  "unique_by_kind": {
    "main": 8509,
    "variant_or_parallel": 3959,
    "extra_not_attached_to_main_chain": 30
  },
  "exclusive_unique_by_kind": {
    "main": 8442,
    "variant_or_parallel": 3895,
    "extra_not_attached_to_main_chain": 17
  },
  "intersections": {
    "main_and_variant_only": 59,
    "main_and_extra_only": 8,
    "variant_and_extra_only": 5,
    "all_three": 0
  },
  "note": "main is the dictionary prev/next body chain; variant_or_parallel is same prev/next attached rows, mostly traditional or variant forms; extra records are in 21003 set but not attachable to that chain."
}
