⺡𦰩 ⾔吾大词典 2025.09 (2025.10.20 六订+)

数据来源

含订补版内容,注意部分词条存在错误或缺失。

缺失词头使用飞悟版数据和个人OCR校对数据,词头有额外标识

特色

  • 最新2025.09 douyin 数据,包含订补版
  • 仿漢語辭典總匯,包含 【焕新版】漢語大詞典2.0 所有功能
  • 超61.8万词头 (包含繁简体)
  • 抖音数据实体标记(下划线)
  • 图片与义项对应
  • tts词头发音(需在js启用)
  • ai引证解释 (需在js启用,并配置 api)

预览

不同来源(见词头)

发音tts 与 AI解释

自定义配置

js功能配置

css 释义、引证包裹配置

hdcs:not(.fw) quote::before {
    content: "「";
}

hdcs:not(.fw) quote::after {
    content: "」";
}

submean xh::before {
    content: "(";
}

submean xh::after {
    content: ")";
}

已知数据问题

updated: 已改成xml数据源

使用建议

无论是抖音源,还是jd xml源,仍然存在部分错误。

建议 搭配图片版使用,百度网盘中已提供个人优化版。

下载

百度

限速问题:建议手机下载,PC客户端可开启共享带宽,或者自行找寻找在线解析站或脚本

30 个赞

这不起飞,终于有一个聚典级别的hdc了 :clap:
那我第一个就查“性業”,第二个查“󰅘𩵻”,第三个“爱手反裘”
然后“”“”“”“”

leon哥太牛啦 :smiling_cat_with_heart_eyes:

今夜不寂寞,我爱Leon。

还有,部分页边距没必要留白那么多。。。。

子义项例证对齐的是小括号,程序员看了很满足

感谢Leon兄持续完善该词典,非常期待早日定版投入使用。现有两点期望,不知大佬可否予以考虑。

  1. 将表示子义项序号的括弧从全角“()”改为半角“()”;或者干脆改用其他只占一个汉字位置的序号风格,如带空心圆圈的数字。

  2. 各义项的例证缩进到与对应释义对齐,而非与释义序号号对齐。

关于第2点,可能会损失一定的屏显空间,特别是对于手持设备而言,但该大型词典的使用场合,恐怕还是以大屏设备查阅居多。

道理,我倒是懂,为了区分主次父子关系。
我的意思,没必要。子义项屏幕左侧留空太多,,,,,,

你先和楼上的打一架,谁赢了采纳谁的方案… :melting_face:

试用一下,确实堪称目前汉大的最佳版本了!只是AI功能不能使用,不太会设置opengai。

妥了!
这个非常可以!

如果可以,你可以做下手机端的适配

哪位大佬可以发一个只开启ai解释,不开启语音的js。

确实TTS发音,无意义。

AI解释,倒是可以尝鲜。

更新文档了,只需注册账号,复制配置信息,配置ak即可

1 个赞

《汉语大词典》虽然我个人感到品质不是太理想,但地位显赫,收词庞大,简单快速查询参考还是非常有用的。论坛里曾有很多人想着手订正,可因为种种原因,多是半途而废,或者闭门造车、互相冲突,终于在leon兄手里,成了集大成之作,实在可喜可贺。

我看了一下, 想到四个可能的问题,不揣寡陋,提出来请leon兄参考。

1)可否顺便也提供一个本论坛网盘的下载链接,扩大受众,我知道有不少人是不能或者不想用百度网盘的。

2)《汉语大词典》名望既崇,有了当下这个更完善的底本,跃跃欲试想对它予以个性化装修,或者进一步校订的人想必颇有一些,那么如果能够再提供制作或者生成时的原始文件,图片、txt、html等,则就更便捷完美了。MDX当然可以自己解压反编译,但因为其天生设计缺陷,原始文件和解压出来的不是一回事,起码词头顺序乱成一锅粥。

3)本词典体量惊人,来源纷杂,个人再怎么认真整合校订,总会存在这样那样的毛病,那么是否可以提供一个渠道或者设计一个办法,能够集众人之力,合作编辑校正,而兄总其成。我暂时想到的是用github,不过词典文件太大了,怕改不动,github也有一定的使用门槛。

4)词典本为残损,渊源复杂,如果有一些基本的统计数据,比如总词头,待补词条或者例证,源自光盘2.0的词条量,OCR数据等,别人看起来心里就会更有底细。

1) 论坛网盘满了,而且上传速度慢,文件管理功能相对较差,早就不用了。看有没人愿意协助上传。 没有会员,可以用手机下载,或者PC开共享带宽。
2) 百度网盘已更新。同一个字的多词头都已经合并到一个了,工具解压即可,不影响。
3) 先找问题,目前已筛出可能提取错误的词条数据,待确认,整理后会发帖。前两个校对贴,坛友积极性不高。
4)这个后面在词典说明里加上

网友积极性不高,可能是因为老虎吃天,不知何处下爪。我想基本的统计信息还是比较重要的,总数据是多少,和图像版相比有何差距、差异,哪些数据质量可疑,需要复核,哪些词头、例证残缺,需要另找数据源,哪些干脆只能自己OCR,即使OCR的,又有哪些精校过,哪些粗校需要复查等。

有了这些基础信息,各人就可以选择自己感兴趣也擅长的领域各逞其技,否则面对这么大一个词典,真不知道该从何处着手。

建议你们俩进singbai他们现成的qq群吧,方便交流,互通有无

现在哪还有人用qq。

有,传资料也方便