万有知典(商务)的新产品vdict

看了一下,它的數據似乎有些問題。應該就是商務給海笛的數據,就是涵芬APP的數據,主要詞典我之前都爬過了。

這些數據 後來他們似乎又加工(修正?)了一下,做了這個網頁版。

古漢2,有些詞條不全,如:上台、先后、冲冲,多音字詞條,只收錄了一條。這個和海笛的毛病一樣,同樣缺失了。
有些數據和紙書不一致,如:鞇。不知是不是電子版數據又修訂了。
對比,工作量太大,我目前沒時間弄這個。看誰有興趣,可以對比、完善

3 个赞

新时代英汉有爬过吗?

这个没有。。。

1 个赞

陀佛哥, 知网 张拱贵、王聚元主编的《汉语叠音词词典》可以爬取制成mdx词典吗?这部词典还是挺有电子化价值的 :smiley:

大神,能否分享爬下的东西和对应的mdx啊,尤其新时代汉英,能否试着爬一下啊。

现汉收词也不全,像“郦食其、舍利子、丽水”等都没有。许多带儿化音的词虽收但缺音频文件,共下载音频文件54636。不知道带儿化音的音频app中有没有,比如“赶明儿”。

官方APP也没有这三个,但是有儿化音。

多谢!唉,我又粗心了!刚才核实了一下,这三个词是在词典正文中,不是词条。

粗心有时也是好事。我不甘心,又看了前面对r处理有误时下载的一部分,竟然发现了儿化音,只是不是他们链接中er5,而恰恰就只是一个r。这些可爱的工程师们,也和我一样粗心,呵呵。

1 个赞

好消息,好消息,隔壁klwo2放出了一些爬虫成果制作的mdx,需要的朋友可以前去下载了。

3 个赞

能转过来文件吗?隔壁z看不到那个板块了啊!

在 掌上百科编纂处,头个帖子

谢谢告知。。。。。。。。。。。

提取码:klwo

感谢转发!!
这些辞典非常好。下午在隔壁下了。但是发现文字显示过大,行间过大。应该是CSS设置问题。我等小白还不会调整这么复杂的设置。a大能否将CSS调整一下。估计几部辞典都是一个模式。

我没时间弄,自己都没调整,我也想伸手要呢。

有个大神弄了两个

2 个赞

https://pan.huang1111.cn/s/e62Mfg
密码:Klwo2

1 个赞

理解 。小白目前只会调整字体颜色等最基本的。从这个论坛确实学习到很多知识。感谢分享的这两个CSS文件。