您现在的位置是：首页 > 后端

当前栏目

python爬百度首页

Python 百度首页

2023-09-14 09:08:38 时间

使用requests模块

import requests
res=requests.get("http://www.baidu.com")
res.encoding='utf-8-sig'

file=open('baidu.html','w',encoding='utf-8-sig')
file.write(res.text)
file.close()
print(res.text)

或者

import requests
url='https://www.baidu.com'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
}
get_response = requests.get(url,headers=headers,params=None)
page=get_response.content
with open('baidu2.html','wb') as f:
    f.write(page)
print(get_response.text)
print(get_response.content)
print(get_response.json)

get_response.text得到的是str数据类型。
get_response.content得到的是Bytes类型,需要进行解码。作用和get_response.text类似。
get_response.json得到的是json数据。
使用urllib模块

import urllib.request

headers = {
     'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
 }
req=urllib.request.Request(url='http://www.baidu.com',headers=headers)
response=urllib.request.urlopen(req)
webpage=response.read()

with open('baidu3.html','wb') as f:
     f.write(webpage)

猜你喜欢

如何选择适合自己的MySQL下载版本（mysql下载选哪个版本）
实现图
R包”gwasrapidd”------快速获取GWAS Catalog数据库的信息
Linux共享内存中的锁机制（linux共享内存锁）
MySQL视图整合两张表数据（mysql两张表视图）
Linux下SPI驱动详解（spilinux）
Debian 开发者正在为 Debian 打包 Unity 8 桌面环境
清华团队将Transformer用到3D点云分割上后，效果好极了丨开源
Oracle 数据库保证企业信息安全稳定运行（f oracle）
安全Redis使用之防火墙设置（redis防火墙）
MySQL主从复制之GTID模式详细介绍
中学教材现黄色网站人教社回应遭网友质疑

相关主题

Python中的函数
PYTHON--CLASS
python input函数
python的self
python爬虫(一)
python和C#

zl程序教程

当前栏目

python爬百度首页

相关文章