我曾经用Unicode的数据unihan.zip做了一个Access的汉字资料库,再加入笔画码的数据,用部首加笔画码检索,用起来挺顺手。
但是我的资料库只有7万多字,许多还没有笔画码,也缺少后出的类推简化字,要处理这个有不少类推简化字的《现汉7》mdict,就寸步难行。
看到本坛的《叶典》mdict说明有“两分法”检索,得到灵感。用getdict解开mdict,把有“两分法”跳转的Unicode汉字都收入我的Access资料库,再加入“两分法”数据。
现在我的Access资料库有9万多字,新增加的2万多字有很多无法显示。但是类推简化字都有了,可以用“两分法”检索。
所以现在处理的速度稍微快了一点。
第4轮修改
{马丕}:駓(图像版“”(U+E0BA)非unicode正字。)
{阝齐}:隮(图像版“”(U+E0B5)非unicode正字。)
{马冋}:駉(图像版“”(U+E0BC)非unicode正字。)
{土夅}:{土夅}(图像版“”(U+E0C3)非unicode正字。)
{艹问}:蔄(图像版“”(U+E0C4)非unicode正字。)
{艹那}:{艹那}(图像版“”(U+E0C5)非unicode正字。)
{目见}:睍(图像版“”(U+E0CA)非unicode正字。)
{山/成}:峸(图像版“”(U+E0CB)非unicode正字。)
{山曲}:{山曲}(图像版“”(U+E0CC)非unicode正字。)
{钅夫}:鈇(图像版“”(U+E0CD)非unicode正字。)
{钅长}:鋹(图像版“”(U+E0CF)非unicode正字。)
{钅仑}:錀(图像版“”(U+E0D1)非unicode正字。)
{女华}:嬅(图像版“”(U+E0D8)非unicode正字。)
{糸因}:絪(图像版“”(U+E0D9)非unicode正字。)
{马先}:駪(图像版“”(U+E0DA)非unicode正字。)
{糸延}:綖(图像版“”(U+E0DC)非unicode正字。)
{糸廷}:綎(图像版“”(U+E0DB)非unicode正字。)
{责力}:勣(图像版“”(U+E0DF)非unicode正字。)
{木夹}:梜(图像版“”(U+E0E4)非unicode正字。)
{支页}:頍(图像版“”(U+E0E5)非unicode正字。)
{车光}:輄(图像版“”(U+E0E6)非unicode正字。)
{山/大/车}:輋(图像版“”(U+E0E7)非unicode正字。)
{钅术}:鉥(图像版“”(U+E0E8)非unicode正字。)
{钅卢}:鑪(图像版“”(U+E0E9)非unicode正字。)
{钅申}:鉮(图像版“”(U+E0EA)非unicode正字。)
{钅召}:鉊(图像版“”(U+E0EB)非unicode正字。)
{亻单}:僤(图像版“”(U+E0EE)非unicode正字。)
{饣束}:餗(图像版“”(U+E0F2)非unicode正字。)
{火寻}:燖(图像版“”(U+E0F5)非unicode正字。)
{阝兒}:{阝兒}(图像版“”(U+E0F7)非unicode正字。)
{马余}:駼(图像版“”(U+E0FE)非unicode正字。)
{纟希}:絺(图像版“”(U+E0FF)非unicode正字。)
{纟完}:綄(图像版“”(U+E100)非unicode正字。)
{丰刀/石}:䂮(图像版“”(U+E102)非unicode正字。)
{土单}:墠(图像版“”(U+E105)非unicode正字。)
{艹卓}:䓬(图像版“”(U+E108)非unicode正字。)
{石达}:䃮(图像版“”(U+E10B)非unicode正字。)
{由页}:頔(图像版“”(U+E10E)非unicode正字。)
{虫东}:蝀(图像版“”(U+E10F)非unicode正字。)
{钅圭}:銈(图像版“”(U+E111)非unicode正字。)
{钅共}:鉷(图像版“”(U+E112)非unicode正字。)
{钅达}:鐽(图像版“”(U+E113)非unicode正字。)
{贸阝}:鄮(图像版“”(U+E117)非unicode正字。)
{氵国}:漍(图像版“”(U+E119)非unicode正字。)
{汤/玉}:璗(图像版“”(U+E11A)非unicode正字。)
{讠垔}:諲(图像版“”(U+E11C)非unicode正字。)
{讠咸}:諴(图像版“”(U+E11D)非unicode正字。)
{讠是}:諟(图像版“”(U+E11E)非unicode正字。)
{讠叟}:謏(图像版“”(U+E11F)非unicode正字。
{纟青}:綪(图像版“”(U+E123)非unicode正字。
{马非}:騑(图像版“”(U+E124)非unicode正字。
{马匋}:騊(图像版“”(U+E125)非unicode正字。
{纟京}:綡(图像版“”(U+E126)非unicode正字。
{纟享}:綧(图像版“”(U+E127)非unicode正字。
{马录}:騄(图像版“”(U+E128)非unicode正字。
{土娄}:塿(图像版“”(U+E131)非unicode正字。
{土扁}:{土扁}(图像版“”(U+E132)非unicode正字。
{木质}:櫍(图像版“”(U+E134)非unicode正字。
{车兒}:輗(图像版“”(U+E137)非unicode正字。
{齿介}:齘(图像版“”(U+E138)非unicode正字。
{目闰}:瞤(图像版“”(U+E139)非unicode正字。