爬取人人词典,出现小问题,希望有人能帮帮忙

使用 python 3.8.1 , BeautifulSoup ,requests 代码如下, 目前希望打印的结果v. n.能换行, 再者就是目前是输入的单词在链接上, 该怎么写 , 让其自动爬取单词 释义呢, 然后是保存到一个文件里面去 , 目前只是打印到控制台上了。 自己先练练手 , 代码也不是很了解。

下图是控制台的打印结果

将 v. n. 替换成前面带一个换行符的再打印。

https://www.runoob.com/python3/python3-tutorial.html

1 Like

谢谢 ! v. n. 是直接 用

soup = BeautifulSoup(html, ‘html.parser’)
div = soup.find(name=‘div’, attrs={‘class’: ‘listBox’})
取出来的 我不知道该怎么加进去 :joy:

https://docs.python.org/3.8/library/stdtypes.html?highlight=replace#str.replace
或者用正则
https://docs.python.org/3.8/library/re.html?highlight=re%20sub#re.sub

不应该用get_text,那样标签就没了。标签还在的话,可以很方便地排版。

本来就没标签的。

那 。。。。。 如果有哪位爬取的代码 , 可以看看就好了

好吧,只好查找替换了。

我改了一下 , 现在这个效果
image

我抓取的是 人人词典的单词、释义, 后面抓取的例句的代码还没写呢, 这次抓取是想练练手, 想尝试一下自己做mdx

这样啊 ! 我只是练手, 看见论坛有人求人人词典的mdx文件 , 就拿它试手了。

1 Like