抖音汉语 2025-09-14 终结,622296 词头


原版ui挺好看的,有没人复刻下啊


你看,又急

个人找到 61.1W 遗漏的 1731条,大部分非汉大词头
dyNew.txt (57.0 KB)

已有简体词头,但缺汉大繁体的 近7k
redirect.txt (113.1 KB)

谢谢,

以下是1731里面已经有的13个

阿Q - 抖音汉语
㖫 - 抖音汉语
鑉𬬻 - 抖音汉语
搢𬘩 - 抖音汉语
阿Q - 抖音汉语
上下之分 - 抖音汉语
栓Q - 抖音汉语
活现眼 - 抖音汉语
芭比Q了 - 抖音汉语
T恤衫 - 抖音汉语
AA制 - 抖音汉语
好高务远 - 抖音汉语
孟敏堕甑 - 抖音汉语

弄好了分享给大家。

你这方面最棒,其实我一开始就准备复刻,只是笨拙。
再试一下,看看是不是好看一些。

你怎么也会汉语?

我们是程序猿群。。。


最后一锅,到时候有多少算多少,
我不是程序员,我最多只会print“hello world”

最新版本用leon的font可以显示,但是json里面的错别字就没法系统修正了。

你是遵循程序的员。

更新了0.mdd,像官网,好看一点点。

不过现在例句按钮跟着页面跑了

MDict_Db3te67Nqs

1 个赞

好奇这标签怎么和官网的不一样,要是一样就能直接用官网的css


搞完了,61.67w,包含L大1700,以及所有(DocID,doc_id)
另外还有600的词必定存在,但是无法搜索,且想找的时候在列表中找不到
【汉语大词典】ID53.rar (5.7 MB)




【汉语大词典】ID53.rar (5.7 MB)

ps,L大4小时找出1700个ID,要么撞库的词头比我全,例如“周公吐哺,天下归心”,我准备的123w词头不含该词头,要么chromedriver稳定性比我高,例如Unicode“𣏺”,我遍历过9.8w的Unicode16,中途有报错,未在意,要么就是基于ID的猜测算法概率比我高,我150w,7小时,产出500,较L大4小时产出1700, :sweat_smile:告辞

因为html结构,tag和class都不一样,没法直接套用。除非用官网的js生成一样的html?

可以修补词性格式。

谢谢分享,如果完工了我加进去补最后一把。

我这边是收工了,
分享“一”的完整网页,包含css,js,json,
一.zip (1.3 MB)

1 个赞

怎么可能?一直都是给你id,加词头 ,csv.

没事,你的DocId去掉现有的和Leon的,一共4408新增的,赞。

“三餘”在抖音汉语中是“三余”,“中爲”就是“中为”,不过“中爲”第一版没有,是订补中的。而“中閫”之“中阃”在官网上有,不知为什么漏了。