我已经把修正过字头的《现代汉语词典》7版图像切词版发出来,有兴趣的书友可以参考:
请改用2022年元旦修订的mdx
现在根据这个版,把切词图像的页码编号抽出来,上载于此,供大家参考。格式为Unicode 8 xml文本。
简单说明格式:
序号|字头|页码及字头位置
1|a1|0001-001
2|吖〖U+5416〗|0001-002
序号依照页码及字头位置排序。0001-002为第1页第2字。
字头为单字、词或汉语拼音。1、2、3、4分别代表四声,0为轻声。
单字后面加了〖U+XXX〗。可以用别的方法查到U+XXX,再用U+XXX找到该字在《现汉7》中的页码。不过要注意,为了尽量显示所有字,我用可见或可检索的繁体字,替代了一些类推简化字,所以〖U+XXX〗也跟着改变了。
假如发现有错误,欢迎大家跟贴反映。
请改用2022年元旦修订的索引
少实斋
多虚不如少实