求助大神 怎么抓网站制作mdict 想学习一下 有点无从下手

比如我想把这个网站上的这个词典中的每个条目都抓下来并保持网页原格式
Русско-китайский словарь (academic.ru)

具体要怎么做呢?
是否需要学习编程?
学习C、C#、python,还是?

做词典不需要学习编程。爬取网站数据,需要学习Python,需要先学完基础教程:

安装Python3:

基础教程:

然后学习爬取网站数据:

2 个赞

哇哦o(^@^)o
谢谢谢谢ヾ(≧▽≦*)o

这种的数据能爬下来吗?https://www.kdocs.cn/l/ccl8y1FuKj80

要扫码我没尝试,如果可以下载,这种 excel 表格直接导出成 csv 文件就可以了。如果不让下载,这种数据也可以爬下来,但会很复杂,不是刚入门的人能搞定的。

谢谢,看来还得多学点东西才行。

谢谢,看来还得多学点东西才行。

动态的网页,需要使用类似 Playwright (链接) 这种无头浏览器爬取,金山文档又更复杂一些,还需要学习Javascript,外加一点踹门的技巧。大多数时候,学会使用无头浏览器就够用了。