借着春节假期之便,我新注册了一个汉语辞典总汇网站的账号并充值七天会员,手动抓取了汉语大词典完整的字头清单(分隶于200个部首之下,正体/异体、简体/繁体字计有23402字)以及第一册词目(按十二册旧版部首进行搜录,单音节词不在采集之列),希望有资于本坛辞典发烧友进一步搜罗、加工汉大词条数据。需要指摘出来的是,辞典总汇抓取的词目初步比照原书,有失收之处四处,分别是“丏(丐的讹字)、厩(廄的异体字)、脩(修的异体字)、𠊳(便的古字)”四字附随词目(释义、例证亦告缺如)。就此看来,辞典总汇版的数据也难称得上尽善尽美,但相较于光盘版以及坊间基于光盘版反复“葺补”的版本仍有很大进步了。
汉大部首字表.zip (99.9 KB)
汉大分册1词目.zip (215.1 KB)
【20250729】
汉大字表
汉大部首字表e.txt (122.4 KB)
汉大词表
汉大总词目表(初步汇总).xlsx (4.1 MB)
初步查核汉大光盘版文本较之纸质版文本缺收复音节词条4438笔(词头同形异音通计一笔,增订本复音词未在核对统计范围之内),光盘版文本较之纸质版文本复音节词条存在缺例者约计一万三四笔左右。