python爬百度首页
2023-09-14 09:08:38 时间
使用requests模块
import requests
res=requests.get("http://www.baidu.com")
res.encoding='utf-8-sig'
file=open('baidu.html','w',encoding='utf-8-sig')
file.write(res.text)
file.close()
print(res.text)
或者
import requests
url='https://www.baidu.com'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
}
get_response = requests.get(url,headers=headers,params=None)
page=get_response.content
with open('baidu2.html','wb') as f:
f.write(page)
print(get_response.text)
print(get_response.content)
print(get_response.json)
get_response.text得到的是str数据类型。
get_response.content得到的是Bytes类型,需要进行解码。作用和get_response.text类似。
get_response.json得到的是json数据。
使用urllib模块
import urllib.request
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
}
req=urllib.request.Request(url='http://www.baidu.com',headers=headers)
response=urllib.request.urlopen(req)
webpage=response.read()
with open('baidu3.html','wb') as f:
f.write(webpage)
相关文章
- [Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒
- 百度快排发包python核心源码
- 百度Aip人脸识别之python代码
- requests爬取百度贴吧:python 美女 3
- python调用百度人像动漫化
- Python 刷Leetcode题库,顺带学英语单词(37)
- python 如何使用pip安装第三方软件
- Py之twilio:python库之twilio的简介、安装、使用方法之详细攻略
- 这10个Python性能调优的小技巧,你知道几个?
- Python爬虫:调用百度翻译接口实现中英翻译功能
- 微软开源最强Python自动化神器Playwright,不用写一行代码
- Python接口自动化核心模块 - 数据库操作和日志
- Python——break、continue、pass语句作用
- 【状态估计】将变压器和LSTM与卡尔曼滤波器结合到EM算法中进行状态估计(Python代码实现)