百度汉语也买了聚典数据库。
那你能帮帮我,把所有、或者尽可能多的聚点平台的网站和app的都截图放上来吗?测试的词语:性业/性業,囂浮/嚣浮,嘉应,三监/三監,划洋火,可小刀
牛,一个字9个读音,不过,其实就是湛字,汉大上湛至少也标了6个读音。
ID可以一鱼四吃,除了可以用来补全“飞地”状态的私人字词,还可以用来索引type=4的诗词,和抖音百科,抖音视频,
诗词
译文,简介,赏析,创作背景,都是不同的书籍,
吴鸥 . 杜牧诗文选译 . 成都 : 巴蜀书社 , 1991 . 122-123 .
杨吉元主编 . 中华经典日日诵 小学卷 5 . 杭州 : 浙江古籍出版社 , 2011-08 . 16 .
于海娣 等 . 唐诗鉴赏大全集 . 北京 : 中国华侨出版社 , 2010 . 373-374 .
萧涤非 等 . 唐诗鉴赏辞典 . 上海 : 上海辞书出版社 , 1983 . 1063-1065 .
抖音百科之杜牧
https://www.baike.com/wikiid/7182160540768206909
百科词条的观感也比百度的好多了,没有乱七八糟的广告,视频,
短视频之杜牧
https://www.douyin.com/video/7355450512117927204
把私人字词补齐,诗词补齐,百科补齐,岂不美哉,这一说又是大工程
告辞
ps,思路是有的,用2.7w的汉字先走一遍之前的流程,(type=2的词,type=3的成语)过一遍type=4的诗词,此时DocID为诗词,doc_id为百科
然后百科用keyword=158w词头过一遍,
此时DocID,doc_id皆为百科,
然后左脚踩右脚,∑(DocID,doc_id)
最后就是猜测150w的ID,往私人字,诗词,百科的地址套,套中什么算什么
你补全数据我就做成mdx
现在主要就是那8000词找ID,卡住了,自动的话。成功率不是100%,手动的话眼睛看花了,让ai改代码感觉不如直接和它聊天玩, ![]()
以下官网的发音不全
不胜杯杓 - 抖音汉语
既来之,则安之 - 抖音汉语
返朴归真 - 抖音汉语
詛魘 - 抖音汉语
割鸡焉用牛刀 - 抖音汉语
月晕而风,础润而雨 - 抖音汉语
椧 - 抖音汉语
豆分瓜剖 - 抖音汉语
升米恩,斗米仇 - 抖音汉语
风雨调顺 - 抖音汉语
美不胜录 - 抖音汉语
弃之若敝屣 - 抖音汉语
含华咀英 - 抖音汉语
钄 - 抖音汉语
兴波作浪 - 抖音汉语
事与心违 - 抖音汉语
尘埃未定 - 抖音汉语
钣金 - 抖音汉语
1.mdd 发音
2.mdd 图像 (字体)
8.24更新后,还用保留之前做的补集么。
之前的是子集,反正我已经删了
好的,那我也删。
分享下个人微调版css/js
抖音汉语.zip (4.3 MB)
- 兼容 GoldenDict-ng
- 加入之前HDC的pua字体
- 样式微调,默认light-mode
pua字已经整理好,共742个,已按出现数量排序,看有没有人用hdc-pua字体对照,手动做映射转uniHan的中文
pua.zip (5.7 KB)
PS. 发现原来的hdc-pua还缺少一个字
U+F02CF: 50 虩
某些词头内容是全的,但是mdictpc显示为掐断的,不知为何,比如 [維嵩],新版已经修复(維嵩 - 抖音汉语)
@leon406 pua是啥缩写?mdictpc貌似无效,打算采纳pua然后使得mdictpc可以显示。另外发音按钮可以保留
@kking 你能把额外的76个加进去(ttf/woff/woff2+css)么
还有大约7000个新词头,在加上未知数量的recursive
成语得等search来完善。
楼上的字体文件是完整,76个字。缺少的不是字体文件,而是 Json,这76个字全部搞出来,那要抽奖。pua就是私人字,看得见搜不出来。
结构残缺,释义缺失
你打开source,内容完整的。











