您现在的位置是：首页 > 后端

当前栏目

使用Python爬取网页的相关内容（图片，文字，链接等等）

Python 网页链接图片相关内容文字爬取

2023-09-14 08:58:07 时间

代码解释的很详细了，有不明白的欢迎评论 ~~~滑稽


import requests
from bs4 import BeautifulSoup

# #获取图片   输入网址
req=requests.get("https://blog.csdn.net/a1439775520/article/details/95373610")
#获取网址的html
html=req.text
#print(html)
#使用beautifulsoup接受这个html
soup=BeautifulSoup(html,"html.parser")
#加入count是为了有多张图片，防止名字相同被替换掉
count=0
#for循环   找到所有img标签   获取其他元素也可以写别的标签
for img in soup.find_all("img"):
#得到他的src属性
    src=img.get("src")
    print(src)
    #请求src的路径
    req=requests.get(src)
    #在这里传入你想保存的文件夹
    with open('D:\\PyCharm_Filr\\temp/' + str(count) + '.jpg', 'wb') as f:
        #req.content就是获取src的内容，就是他的图片
        f.write(req.content)
    count=count+1

猜你喜欢

oozie中时间EL表达式
一个SAP S/4HANA CDS view extension的具体例子
OS Boot Loader -- 启动器
互动赠新书｜当云原生遇到混合云：如何实现“求变”与“求稳”的平衡
你该怎么学习C++——思想层面
第18篇 QML动态元素之动画分组
JS实现鼠标悬停变色
这样学Python，数据分析从0到1轻松入门（下）
使用Async对Angular异步代码进行单元测试
Atitit vue.js 把ajax数据绑定到form表单
第十四届蓝桥杯集训——练习解题阶段(无序阶段)-ALGO-680 数的计算
String与StringBuffer的区别
php安全字段和防止XSS跨站脚本攻击过滤函数
Windows非公开API函数的调用办法
【华为云技术分享】云小课 | 磁盘容量不够用？小课教你来扩容！
设计模式 --迭代器模式（Iterator）
【预测模型】三次指数平滑预测算法
什么是加载因子/负载因子/装载因子
ZendFramework2学习笔记 json和ajax

相关主题

python socket模块
python(四)
python 初识
Python: filter
Python __slots__
Python 类的介绍
python学习①

zl程序教程

当前栏目

使用Python爬取网页的相关内容（图片，文字，链接等等）

相关文章