数据来源
含订补版内容,注意部分词条存在错误或缺失。
缺失词头使用飞悟版数据和个人OCR校对数据,词头有额外标识
特色
- 最新2025.09 douyin 数据,包含订补版
- 仿漢語辭典總匯,包含 【焕新版】漢語大詞典2.0 所有功能
- 超61.8万词头 (包含繁简体)
- 抖音数据实体标记(下划线)
- 图片与义项对应
- tts词头发音(需在js启用)
- ai引证解释 (需在js启用,并配置 api)
预览
不同来源(见词头)
发音tts 与 AI解释
自定义配置
js功能配置
css 释义、引证包裹配置
hdcs:not(.fw) quote::before {
content: "「";
}
hdcs:not(.fw) quote::after {
content: "」";
}
submean xh::before {
content: "(";
}
submean xh::after {
content: ")";
}
已知数据问题
updated: 已改成xml数据源
使用建议
无论是抖音源,还是jd xml源,仍然存在部分错误。
建议 搭配图片版使用,百度网盘中已提供个人优化版。
下载
百度
限速问题:建议手机下载,PC客户端可开启共享带宽,或者自行找寻找在线解析站或脚本
30 个赞
kking
2
这不起飞,终于有一个聚典级别的hdc了 
那我第一个就查“性業”,第二个查“𩵻”,第三个“爱手反裘”
然后“”“”“”“”
感谢Leon兄持续完善该词典,非常期待早日定版投入使用。现有两点期望,不知大佬可否予以考虑。
-
将表示子义项序号的括弧从全角“()”改为半角“()”;或者干脆改用其他只占一个汉字位置的序号风格,如带空心圆圈的数字。
-
各义项的例证缩进到与对应释义对齐,而非与释义序号号对齐。
关于第2点,可能会损失一定的屏显空间,特别是对于手持设备而言,但该大型词典的使用场合,恐怕还是以大屏设备查阅居多。
道理,我倒是懂,为了区分主次父子关系。
我的意思,没必要。子义项屏幕左侧留空太多,,,,,,
试用一下,确实堪称目前汉大的最佳版本了!只是AI功能不能使用,不太会设置opengai。
茕鬼爱折腾
13
哪位大佬可以发一个只开启ai解释,不开启语音的js。
更新文档了,只需注册账号,复制配置信息,配置ak即可
1 个赞
《汉语大词典》虽然我个人感到品质不是太理想,但地位显赫,收词庞大,简单快速查询参考还是非常有用的。论坛里曾有很多人想着手订正,可因为种种原因,多是半途而废,或者闭门造车、互相冲突,终于在leon兄手里,成了集大成之作,实在可喜可贺。
我看了一下, 想到四个可能的问题,不揣寡陋,提出来请leon兄参考。
1)可否顺便也提供一个本论坛网盘的下载链接,扩大受众,我知道有不少人是不能或者不想用百度网盘的。
2)《汉语大词典》名望既崇,有了当下这个更完善的底本,跃跃欲试想对它予以个性化装修,或者进一步校订的人想必颇有一些,那么如果能够再提供制作或者生成时的原始文件,图片、txt、html等,则就更便捷完美了。MDX当然可以自己解压反编译,但因为其天生设计缺陷,原始文件和解压出来的不是一回事,起码词头顺序乱成一锅粥。
3)本词典体量惊人,来源纷杂,个人再怎么认真整合校订,总会存在这样那样的毛病,那么是否可以提供一个渠道或者设计一个办法,能够集众人之力,合作编辑校正,而兄总其成。我暂时想到的是用github,不过词典文件太大了,怕改不动,github也有一定的使用门槛。
4)词典本为残损,渊源复杂,如果有一些基本的统计数据,比如总词头,待补词条或者例证,源自光盘2.0的词条量,OCR数据等,别人看起来心里就会更有底细。
1) 论坛网盘满了,而且上传速度慢,文件管理功能相对较差,早就不用了。看有没人愿意协助上传。 没有会员,可以用手机下载,或者PC开共享带宽。
2) 百度网盘已更新。同一个字的多词头都已经合并到一个了,工具解压即可,不影响。
3) 先找问题,目前已筛出可能提取错误的词条数据,待确认,整理后会发帖。前两个校对贴,坛友积极性不高。
4)这个后面在词典说明里加上
网友积极性不高,可能是因为老虎吃天,不知何处下爪。我想基本的统计信息还是比较重要的,总数据是多少,和图像版相比有何差距、差异,哪些数据质量可疑,需要复核,哪些词头、例证残缺,需要另找数据源,哪些干脆只能自己OCR,即使OCR的,又有哪些精校过,哪些粗校需要复查等。
有了这些基础信息,各人就可以选择自己感兴趣也擅长的领域各逞其技,否则面对这么大一个词典,真不知道该从何处着手。
将作大匠
20
建议你们俩进singbai他们现成的qq群吧,方便交流,互通有无