求助:網路辭典的爬取工具

求助:網路辭典的爬取工具

我搜索了一下,發現有很多人推薦 HTTrack 爬取網站

不過或許是技術太老,最近幾個網站資源都爬不全

求推薦比 HTTrack 更好用的爬取工具

1 Like

先声明,我不内行。

你可以参考以下帖子所介绍的软件:

httrack wget curl scrape & fetch

Mirroring websites using wget, httrack, curl

假如还是不行,可能得自己学Python写程式,本坛的大佬都用Python。当然,Python也不是万能的,有的网站保护得固若金汤。

1 Like

学廖雪峰的python教程会不会超过了

他介紹了3個工具: HTTrack、 Wget 、 curl
我試過了 HTTrack 跟 Wget 都失敗,看來最近辭典網站保護太好
不懂 Python 編程,就沒辦法嘗試 Scrapy + bs4 ,還是感謝回覆。