抖音汉语 2025-09-14 终结，622296 词头

karx · 2025 年8 月 29 日 10:38

原版ui挺好看的，有没人复刻下啊

kking · 2025 年8 月 29 日 12:39

你看，又急

leon406 · 2025 年8 月 29 日 13:33

个人找到 61.1W 遗漏的 1731条，大部分非汉大词头
dyNew.txt (57.0 KB)

已有简体词头，但缺汉大繁体的近7k
redirect.txt (113.1 KB)

meandmyhomies · 2025 年8 月 29 日 15:23

谢谢，

以下是1731里面已经有的13个

阿Q - 抖音汉语
 㖫 - 抖音汉语
 鑉𬬻 - 抖音汉语
 搢𬘩 - 抖音汉语
 阿Ｑ - 抖音汉语
 上下之分 - 抖音汉语
 栓Q - 抖音汉语
 活现眼 - 抖音汉语
 芭比Q了 - 抖音汉语
 T恤衫 - 抖音汉语
 AA制 - 抖音汉语
 好高务远 - 抖音汉语
 孟敏堕甑 - 抖音汉语

meandmyhomies · 2025 年8 月 29 日 15:24

弄好了分享给大家。

meandmyhomies · 2025 年8 月 29 日 15:26

你这方面最棒，其实我一开始就准备复刻，只是笨拙。
再试一下，看看是不是好看一些。

meandmyhomies · 2025 年8 月 29 日 15:27

你怎么也会汉语？

meandmyhomies · 2025 年8 月 29 日 15:28

我们是程序猿群。。。

kking · 2025 年8 月 29 日 15:30

最后一锅，到时候有多少算多少，
我不是程序员，我最多只会print“hello world”

meandmyhomies · 2025 年8 月 29 日 15:31

最新版本用leon的font可以显示，但是json里面的错别字就没法系统修正了。

meandmyhomies · 2025 年8 月 29 日 15:33

你是遵循程序的员。

meandmyhomies · 2025 年8 月 30 日 02:04

更新了0.mdd，像官网，好看一点点。

不过现在例句按钮跟着页面跑了

MDict_Db3te67Nqs

karx · 2025 年8 月 30 日 02:25

好奇这标签怎么和官网的不一样，要是一样就能直接用官网的css

kking · 2025 年8 月 30 日 02:36

搞完了，61.67w，包含L大1700，以及所有（DocID，doc_id）
另外还有600的词必定存在，但是无法搜索，且想找的时候在列表中找不到
【汉语大词典】ID53.rar (5.7 MB)

【汉语大词典】ID53.rar (5.7 MB)

ps，L大4小时找出1700个ID，要么撞库的词头比我全，例如“周公吐哺，天下归心”，我准备的123w词头不含该词头，要么chromedriver稳定性比我高，例如Unicode“𣏺”，我遍历过9.8w的Unicode16，中途有报错，未在意，要么就是基于ID的猜测算法概率比我高，我150w，7小时，产出500，较L大4小时产出1700，告辞

meandmyhomies · 2025 年8 月 30 日 02:42

因为html结构，tag和class都不一样，没法直接套用。除非用官网的js生成一样的html?

可以修补词性格式。

meandmyhomies · 2025 年8 月 30 日 02:43

谢谢分享，如果完工了我加进去补最后一把。

kking · 2025 年8 月 30 日 02:49

我这边是收工了，
分享“一”的完整网页，包含css，js，json，
一.zip (1.3 MB)

kking · 2025 年8 月 30 日 03:34

怎么可能？一直都是给你id，加词头，csv.

meandmyhomies · 2025 年8 月 30 日 03:39

没事，你的DocId去掉现有的和Leon的，一共4408新增的，赞。

sxingbai · 2025 年8 月 30 日 04:23

“三餘”在抖音汉语中是“三余”，“中爲”就是“中为”，不过“中爲”第一版没有，是订补中的。而“中閫”之“中阃”在官网上有，不知为什么漏了。