求助大神怎么抓网站制作mdict 想学习一下有点无从下手

SyringaOblata · 2024 年3 月 8 日 04:16

比如我想把这个网站上的这个词典中的每个条目都抓下来并保持网页原格式
Русско-китайский словарь (academic.ru)

具体要怎么做呢？
是否需要学习编程？
学习C、C#、python，还是？

last_idol · 2024 年3 月 8 日 05:37

做词典不需要学习编程。爬取网站数据，需要学习Python，需要先学完基础教程：

安装Python3：

基础教程：

然后学习爬取网站数据：

SyringaOblata · 2024 年3 月 8 日 06:27

哇哦o(^＠^)o
谢谢谢谢ヾ(≧▽≦*)o

wwr21 · 2024 年3 月 8 日 09:49

last_idol · 2024 年3 月 8 日 10:29

要扫码我没尝试，如果可以下载，这种 excel 表格直接导出成 csv 文件就可以了。如果不让下载，这种数据也可以爬下来，但会很复杂，不是刚入门的人能搞定的。

wwr21 · 2024 年3 月 8 日 11:21

谢谢，看来还得多学点东西才行。

wwr21 · 2024 年3 月 8 日 11:29

谢谢，看来还得多学点东西才行。

last_idol · 2024 年3 月 8 日 11:56

动态的网页，需要使用类似 Playwright (链接) 这种无头浏览器爬取，金山文档又更复杂一些，还需要学习Javascript，外加一点踹门的技巧。大多数时候，学会使用无头浏览器就够用了。

求助大神 怎么抓网站制作mdict 想学习一下 有点无从下手