如何使用python中beautifulsoup库?
2023-03-20 15:24:48 时间
之前教过大家去解析页面的方式,受到很多小伙伴们的喜欢,有不少小伙伴咨询小编要怎么要学习了解能够解析的基于库,这边让小编,想到了requests库的亲兄弟,beautifulsoup库,他可以做到提取页面信息,并且是提取到有用的信息,现在也是人们常作为使用的一种库,大家可以看看理解理解。
老规矩,先学会安装:
方式:pip install beautifulsoup4
测试是否安装成功:
import requests r = requests.get("链接") demo = r.text form bs4 import BeautifulSoup soup = BeautifulSoup(demo, "html.parser")
实例案例演示:
html = bs4.BeautifulSoup(response.text, features='lxml') note_list = html.find_all('ul', class_='note-list', limit=1)[0] for a in note_list.select('li>div.content>a.title'): title = a.contents[0] link = f'链接{a["href"]}' print(f'《{title}》,{link}')
虽然BeautifulSoup也有中文文档,也有一些比较落后的小版本,但是影响不是很大,足够大家在需要解析页面的时候调用了,相信通过上述描述,大家也知道这个库的好用之处了吧,多多学习了解吧~
相关文章
- PyTorch的nn.Linear()详解
- 进大厂必须要会的单元测试
- 新来的总监,把C#闭包讲得那叫一个透彻
- python(牛客)试题解析1 - 简单
- WCH TMOS用法详解
- Ansible - 7 - 性能优化
- Android10 dex2oat实践
- ysoserial CommonsCollections3 分析
- 【单元测试】Junit 4(二)--eclipse配置Junit+Junit基础注解
- Java Timer使用介绍
- python算法库怎么安装?
- python3格式化输出有哪些方法?
- 如何查看python版本
- 怎么卸载spyder?
- 如何用python3输出print对齐?
- 如何用python3输出print变量?
- python3数值格式化输出是什么?怎么用?
- 如何用python3输出dos命令?
- 如何输出python3中的循环?
- 如何学习python遗传算法?