关于抓取Wordsmyth Children’s Dictionary

我打算抽时间自己抓一版,可能会用到Requests和BeautifulSoup。

https://kids.wordsmyth.net/we/?level=2&rid=1

索引?rid从1抓到60908。

感谢bt4baidu的扫盲贴:

https://www.pdawiki.com/forum/thread-13219-1-1.html

4 Likes

好~

wow! it’s a great news…

1 Like

拼凑了几行代码,断点续传实现得很糟糕

003.png

隔壁PDA有个WordSmyth。

不是一个东西,这个网站上有4本字典。

你的python 版本是?

论坛有爬出网站的列子么 ? 或者说是教程

已经抓了快一半儿了,如无意外,下周末应该能完成mdx制作。

3 Likes

爬完了,备个份:

dict.7z (11.0 MB)

3 Likes

对这本词典感兴趣的小伙伴,可以尝试自己做一版mdx。

下面是预处理,供参考:

12.png