如此简单,抄作果效。
貌似所有的js删除以后,完全不影响使用。
打算合并mobile + pc,因为里面的例句貌似不一样。
網頁的json數據有例句,但好像樓主把這一部分刪了。如果原數據還存有,希望能上傳。
另外有志完善詞典的同好,最好能建個群,協同作業,便於討論敏感問題,也避免重複勞動。
我当时只掐头去尾抓了主体,然后洗版头部加个词头,尾部加个</>,就成了,尾部的json没抓
可惜, 要不就是一部完整的漢大之單字版了。
hdx的數據沒有問題,沒有必要重複,現在只需對比出hdx缺失的部分即可。
已经很不错了,毕竟是一项大工程,能做出mdx来就大功一件了。
初步統計,hdc比將作大匠收集的字詞相同的有278239,少89717,多2740。
他网页上面不显示例句啊,就算json里面有例句,我把json抓出来,我也不会玩Json,它也不显示啊,除非修改javascript之类,我也不会,
反正我到时候把 dy上面的都抓去,至于是不是hdc的,那就靠其他人来筛选了。
老兄弄我就不弄了,一是樂得坐享其成,二是不增加網站負擔。不過我覺得只弄hdc少的89717就行了。這89717中有錯誤,弄完後對比一下,沒有弄到手應該不多了,再覆核一下就行了。
没必要抓了,hdc 缺的就是4字的,多出来的不是汉大的数据。如果你需要其他数据,可以忽视我的评论。其他 app 有汉大完整数据,只要等待一个抓取同样简单的就行了。不同 app 对数据重视程度不一样,只需要等待。。
聚典不同平台收录的内容不一样,不一定都是相同来源。可能跟买了多少库有关。
不只缺四字及四字以上的,四字以下的大概缺五萬多,比如“慢來”“慢書”“額外”等等。
你说是这几个词:“慢來”“慢書”“額外”是本论坛的汉大查不到的吗?我怎么都能查到
我說的是hdc
dy好像沒收hd的成語
成语是汉语成语大词典。
这些都有简体的,你还有原始的数据吗,给我发下看看?
确实没有。你是想要hdc的原始数据吗?1g多呢。
1g多gjson?我词头已经补好了,补到41万了,只下了json,2个多g
期待早日竣工