抖音汉语 (汉语大词典+) 2025-09-14 终结,622296 词头



百度的

百度汉语也买了聚典数据库。

那你能帮帮我,把所有、或者尽可能多的聚点平台的网站和app的都截图放上来吗?测试的词语:性业/性業,囂浮/嚣浮,嘉应,三监/三監,划洋火,可小刀

这个字是人才

牛,一个字9个读音,不过,其实就是湛字,汉大上湛至少也标了6个读音。

搜韵里也有聚典,不过,这个没找到搜索入口,它只有变色的字词有聚典内容。

ID可以一鱼四吃,除了可以用来补全“飞地”状态的私人字词,还可以用来索引type=4的诗词,和抖音百科,抖音视频,
诗词


译文,简介,赏析,创作背景,都是不同的书籍,

吴鸥 . 杜牧诗文选译 . 成都 : 巴蜀书社 , 1991 . 122-123 .
杨吉元主编 . 中华经典日日诵 小学卷 5 . 杭州 : 浙江古籍出版社 , 2011-08 . 16 .
于海娣 等 . 唐诗鉴赏大全集 . 北京 : 中国华侨出版社 , 2010 . 373-374 .
萧涤非 等 . 唐诗鉴赏辞典 . 上海 : 上海辞书出版社 , 1983 . 1063-1065 .

抖音百科之杜牧
https://www.baike.com/wikiid/7182160540768206909


百科词条的观感也比百度的好多了,没有乱七八糟的广告,视频,

短视频之杜牧
https://www.douyin.com/video/7355450512117927204

把私人字词补齐,诗词补齐,百科补齐,岂不美哉,这一说又是大工程 :sweat_smile:告辞

ps,思路是有的,用2.7w的汉字先走一遍之前的流程,(type=2的词,type=3的成语)过一遍type=4的诗词,此时DocID为诗词,doc_id为百科
然后百科用keyword=158w词头过一遍,

此时DocID,doc_id皆为百科,
然后左脚踩右脚,∑(DocID,doc_id)
最后就是猜测150w的ID,往私人字,诗词,百科的地址套,套中什么算什么

你补全数据我就做成mdx

现在主要就是那8000词找ID,卡住了,自动的话。成功率不是100%,手动的话眼睛看花了,让ai改代码感觉不如直接和它聊天玩, :skr_guodegang_smoke:

以下官网的发音不全

不胜杯杓 - 抖音汉语
既来之,则安之 - 抖音汉语
返朴归真 - 抖音汉语
詛魘 - 抖音汉语
割鸡焉用牛刀 - 抖音汉语
月晕而风,础润而雨 - 抖音汉语
椧 - 抖音汉语
豆分瓜剖 - 抖音汉语
升米恩,斗米仇 - 抖音汉语
风雨调顺 - 抖音汉语
美不胜录 - 抖音汉语
弃之若敝屣 - 抖音汉语
含华咀英 - 抖音汉语
钄 - 抖音汉语
兴波作浪 - 抖音汉语
事与心违 - 抖音汉语
尘埃未定 - 抖音汉语
钣金 - 抖音汉语

1.mdd 发音
2.mdd 图像 (字体)

8.24更新后,还用保留之前做的补集么。

之前的是子集,反正我已经删了

好的,那我也删。

分享下个人微调版css/js

抖音汉语.zip (4.3 MB)

  • 兼容 GoldenDict-ng
  • 加入之前HDC的pua字体
  • 样式微调,默认light-mode

pua字已经整理好,共742个,已按出现数量排序,看有没有人用hdc-pua字体对照,手动做映射转uniHan的中文

pua.zip (5.7 KB)

PS. 发现原来的hdc-pua还缺少一个字

󰋏	U+F02CF: 50	虩

pua的字还没全部捞出来,用汉大部首字表e.txt中的pua字减去你的pua.txt,还有76个pua汉字,

某些词头内容是全的,但是mdictpc显示为掐断的,不知为何,比如 [維嵩],新版已经修复(維嵩 - 抖音汉语)

@leon406 pua是啥缩写?mdictpc貌似无效,打算采纳pua然后使得mdictpc可以显示。另外发音按钮可以保留

@kking 你能把额外的76个加进去(ttf/woff/woff2+css)么

还有大约7000个新词头,在加上未知数量的recursive
成语得等search来完善。

1 个赞

楼上的字体文件是完整,76个字。缺少的不是字体文件,而是 Json,这76个字全部搞出来,那要抽奖。pua就是私人字,看得见搜不出来。

结构残缺,释义缺失

你打开source,内容完整的。