您现在的位置是：首页 > 后端

当前栏目

python抓取豆瓣图片并自动保存示例学习

Python 自动学习示例图片保存抓取豆瓣

2023-06-13 09:15:15 时间

环境Python2.7.6，BS4，在powershell或命令行均可运行。请确保安装了BS模块

复制代码代码如下:

#-*-coding:utf8-*-
#2013.12.3619:41wnlo-c209
#抓取dbmei.com的图片。

frombs4importBeautifulSoup
importos,sys,urllib2

#创建文件夹，昨天刚学会
path=os.getcwd() #获取此脚本所在目录
new_path=os.path.join(path,u"豆瓣妹子")
ifnotos.path.isdir(new_path):
os.mkdir(new_path)

defpage_loop(page=0):
url="http://www.dbmeizi.com/?p=%s"%page
content=urllib2.urlopen(url)

soup=BeautifulSoup(content)

my_girl=soup.find_all("img")

   #加入结束检测，写的不好....
ifmy_girl==[]:
  printu"已经全部抓取完毕"
  sys.exit(0)

printu"开始抓取"
forgirlinmy_girl:
  link=girl.get("src")
  flink="http://www.dbmeizi.com/"+link

  printflink
  content2=urllib2.urlopen(flink).read()
  withopen(u"豆瓣妹子"+"/"+flink[-11:],"wb")ascode:  #在OSC上现学的
   code.write(content2)
page=int(page)+1
printu"开始抓取下一页"
print"the%spage"%page
page_loop(page)

page_loop().

猜你喜欢

那个在MySQL中的应用与解析（mysql下那个）
用JavaScript给站外链接的cursor进行改造
ORA-25100: TABLESPACE option can only be used with ALTER INDEX REBUILD ORACLE 报错故障修复远程处理
探究Redis哨兵版本信息（查看redis哨兵的版本）
Oracle重建控制文件：一键搞定（oracle重建控制文件）
解决MySQL无法运行文件的问题（mysql不能运行文件）
VNC实现Linux远程连接：一种简单的方法（vnc远程连接linux）
MySQL加入服务：快速安装步骤（mysql添加到服务）
MySQL删除字段轻松删除表中不需要的列（mysql上删除某列）
MySQL查询语句中如何进行上升排序（mysql上升排序）
PYTHON链家租房数据分析：岭回归、LASSO、随机森林、XGBOOST、KERAS神经网络、KMEANS聚类、地理可视化|附代码数据
云计算，人们身边的“云”
重装MySQL服务器，重塑数据库世界（重装mysql服务器）
简历百里挑一，IC企业人才大丰收？

zl程序教程

当前栏目

python抓取豆瓣图片并自动保存示例学习

相关文章