更新：识典古籍网字典，理论收字98682

fuzzygz · 2025 年7 月 30 日 06:41

如此简单，抄作果效。

meandmyhomies · 2025 年7 月 30 日 18:15

貌似所有的js删除以后，完全不影响使用。

打算合并mobile + pc，因为里面的例句貌似不一样。

sxingbai · 2025 年7 月 31 日 02:05

網頁的json數據有例句，但好像樓主把這一部分刪了。如果原數據還存有，希望能上傳。
另外有志完善詞典的同好，最好能建個群，協同作業，便於討論敏感問題，也避免重複勞動。

kking · 2025 年7 月 31 日 02:24

我当时只掐头去尾抓了主体，然后洗版头部加个词头，尾部加个</>,就成了，尾部的json没抓

sxingbai · 2025 年7 月 31 日 02:30

可惜，要不就是一部完整的漢大之單字版了。
hdx的數據沒有問題，沒有必要重複，現在只需對比出hdx缺失的部分即可。

茕鬼爱折腾 · 2025 年7 月 31 日 02:42

已经很不错了，毕竟是一项大工程，能做出mdx来就大功一件了。

sxingbai · 2025 年7 月 31 日 03:16

初步統計，hdc比將作大匠收集的字詞相同的有278239，少89717，多2740。

kking · 2025 年7 月 31 日 03:21

他网页上面不显示例句啊，就算json里面有例句，我把json抓出来，我也不会玩Json，它也不显示啊，除非修改javascript之类，我也不会，
反正我到时候把 dy上面的都抓去，至于是不是hdc的，那就靠其他人来筛选了。

sxingbai · 2025 年7 月 31 日 03:27

老兄弄我就不弄了，一是樂得坐享其成，二是不增加網站負擔。不過我覺得只弄hdc少的89717就行了。這89717中有錯誤，弄完後對比一下，沒有弄到手應該不多了，再覆核一下就行了。

last_idol · 2025 年7 月 31 日 03:41

没必要抓了，hdc 缺的就是4字的，多出来的不是汉大的数据。如果你需要其他数据，可以忽视我的评论。其他 app 有汉大完整数据，只要等待一个抓取同样简单的就行了。不同 app 对数据重视程度不一样，只需要等待。。

茕鬼爱折腾 · 2025 年7 月 31 日 03:54

聚典不同平台收录的内容不一样，不一定都是相同来源。可能跟买了多少库有关。

sxingbai · 2025 年7 月 31 日 03:58

不只缺四字及四字以上的，四字以下的大概缺五萬多，比如“慢來”“慢書”“額外”等等。

fuzzygz · 2025 年7 月 31 日 04:23

你说是这几个词:“慢來”“慢書”“額外”是本论坛的汉大查不到的吗?我怎么都能查到

sxingbai · 2025 年7 月 31 日 04:28

我說的是hdc

sxingbai · 2025 年7 月 31 日 04:53

dy好像沒收hd的成語

kking · 2025 年7 月 31 日 04:54

成语是汉语成语大词典。

last_idol · 2025 年7 月 31 日 05:57

这些都有简体的，你还有原始的数据吗，给我发下看看？

sxingbai · 2025 年7 月 31 日 07:52

确实没有。你是想要hdc的原始数据吗？1g多呢。

kking · 2025 年7 月 31 日 08:28

1g多gjson？我词头已经补好了，补到41万了，只下了json，2个多g

sxingbai · 2025 年7 月 31 日 12:52

期待早日竣工