抓Good Word Guide的代码

1024.7z (1.0 KB)

我发一下python代码吧。这网站"NEARBY WORDS"部分,不是很规整,需要小心处理。

仅为验证可行性,我不会去抓完并做成mdx。有要练手的朋友,确定你所用网络能正常访问该网站后,cd到1024文件夹下,(中断的话,请重复)执行"python test22.py"即可。

4 Likes

有些词头是无效词头(比如0.22),咱提供的代码只能自动跳过一次。如果两个以上无效词头挨一块儿,导致程序中断,则需要手动跳过(去网页上查中断前那个词,找到最近的有效词头,写进相应文件)。

用到的环境/工具:Python,BeautifulSoup,Requests。重点说一下BS,建议把官方文档通读一遍,遇到问题再去“页面查找”,或者Google。多用几次,就可以靠类推、直觉什么的瞎写了,哈。

换个思路,又写了一版。代码更简洁,对无效词头的处理更漂亮。

1024.7z (848 Bytes)

公布代码这个很好,有兴趣的可以像弄切图字典一样慢慢搞搞看看,把代码搞的更健壮