【好奇提问】古音小镜的资源是否能够爬取?

好奇地问个问题:古音小镜的资源,例如里面的某个词典的图片和对应索引,是否能够爬取呢?可以的话,那难易程度如何呢? :face_with_monocle:

看了一下,難度幾乎爲 「易」。不過就看誰感興趣爬了,而且你看小站的聲明中,裏面的 10 餘種資料存在錯誤,這個需要你自己分辨的。

1 Like

谢谢解疑。里面错误较多的应该是文字版资料,我比较感兴趣里面的图片词典,有些是目前 Mdict 词典所未制作的,像尔雅诂林、扬雄方言校释汇证,主要是图像质量都还不错呢。

稍微分析了下(我没学过爬虫哈哈,这方面知识极其有限),图像是最容易抓取的。主要还是索引,网站是js动态数据,发送一个post请求获取单个数据也不难。但我好奇是如何遍历整个词典的索引获取全部的索引数据的~