kking
1
现代汉语方言大词典2025(图文综合版),451422条,2025.09.23
day0修复:
30个乱码修了16个,(剩下14个正文仅标明地区如“拐子-太原”)主要是当初测试第一个词“拐子”就出现乱码,不修心理膈应,
搜汉语大词典搜到这个小站,站内汉语大词典估计也就【汉语大词典-复刻】的水平,没有“性業”,有“愛手反裘”,但是有现代汉语方言大词典的图片,撸了
http://www.kaom.net/
对比论坛内的几个版本的《现代汉语方言大词典》,都为451422条,作出以下优化
词头图片字较多,如𮨻𮨻兒饃,佛版的词头为<img src="/resource/m.20101029-m300-w001-007/aprfonts/m.20101029-m300-w001-007070161.gif"/><img src="/resource/m.20101029-m300-w001-007/aprfonts/m.20101029-m300-w001-007070162.gif"/>兒饃
k版的图片版和不完美文字版,来自
图片版两个mdd,共6.16G,体积太大,
不完美文字版,未引用字体,正文无法显示生僻字,
网站图片清晰,但是若干页面为封面,无法显示词条
直接“三张合成一张”
样式用佛版,
词头正文用“不完美文字版”,引用字体文津宋体2.0
图片用古音小站,空白页面用“图片版”补齐,3001,4105,4106,5331
页面词头为0001到6556,直接输入数字即可
图片显示\隐藏功能来自
已知不足:
mdx中存在30个词头,释义为乱码<div class="shiyi">qRbMcZ1LVxydIz0dJ66tavVkh已修
仍然存在大量图片词头不是图片字头,看不懂,估计是编码,予以保留
mdd图片应该进一步优化,超分,无损压缩之类,或者做成pdf
说明:
css外置,mdd为字体文件,1.mdd为音标图片,2.mdd为页面图片
链接:https://pan.baidu.com/s/1qN2Hqw9hJAasS1iqMbWSGw
提取码:kkkk
8 个赞
这些詞头,应该有一个ID。但好像丢失了。根据上一条和下一条ID,补上ID。
发现少了一些詞头
| 003.10102 |
上吊 |
| 004.10102 |
包袱疿 |
| 005.10102 |
的呀 |
| 005.13645 |
炕 |
| 005.24031 |
㕰 |
| 005.24111 |
眨眼睛 |
| 006.10102 |
殺死 |
| 007.10102 |
無滚笑 |
| 008.10102 |
撿飯豆 |
kking
4
所以完整的ID为
m.20101029-m300-w001-003.010102
嘿嘿,这ID还有这个用途,到时候把ID过一遍看看
茕鬼爱折腾
5
现在一个词头或词条下会出现多个图片,就拿拐子来说,它会在这个地区方言出现一个图片,在下一个地区又出现一个图片,最后光拐子下,可能会出现n多个图片,变成需要上下拖动才能看完的状态。
kking
6
无限词典会这样,每个软件的策略不同,
或者词头添加地名后缀?,拐子-哈尔滨,拐子-济南
加ID有好处,可以照书排序。还可以合并字头,加锚,跳转时能准确跳到位置。
kking
9
缺失的ID列表:
m.20101029-m300-w001-003.010102
m.20101029-m300-w001-004.010102
m.20101029-m300-w001-005.010102
m.20101029-m300-w001-005.013645
m.20101029-m300-w001-005.024031
m.20101029-m300-w001-005.024111
m.20101029-m300-w001-006.010102
m.20101029-m300-w001-007.010102
m.20101029-m300-w001-008.010102
总共缺失 9 个ID
确实是9个,
kking
11
兼容性的问题,我css搞不定,欧路和tango都会如此,单条展示的mdict就不会,快由请css大神,或者用无限,但是无限不能显示隐藏大图,这也很抓马,