用urllib库几行代码实现最简单爬虫-java爬虫代码示例
“”” 使用urllib.request()请求一个网页内容,并且把内容打印出来。
“””
from urllib import request
import chardet
if __name__ == ‘__main__’:
# 有的网站url使用不了 url = “https://www.cnblogs.com/gshelldon/p/13332798.html”
# 打开url把内容赋值给rsp rsp = request.urlopen(url)
# 存取到内存当中是bytes流,使用read方法把rsp的内容读取出来,赋值给变量html。 html = rsp.read()
# 使用decode解码成我们能够看懂的格式。 # print(type(html)) # 查看返回的格式
html = html.decode(‘utf-8’) # 默认的是utf-8 print(html)
返回的内容是html格式的文本
D:ProgramDataAnaconda3envsspiderpython.exe D:/爬虫/v1-最简单的爬虫.py <!DOCTYPE html> <html lang=”zh-cn”> <head> <meta charset=”utf-8″ /> <meta name=”viewport” content=”width=device-width, initial-scale=1.0″ /> <meta name=”referrer” content=”origin” /> <meta property=”og:description” content=”nginx 动静分离 不需要运维来做,开发做的。 动态请求:该请求会调用数据库中的数据。 静态请求:用户请求不会调用数据库。 动态页面:后端开发写的需要调用数据库的页面(python、java、C、p” /> <meta http-equiv=”Cache-Control” content=”no-transform” /> 省略。。。。。。。
相关文章
- 调研数据:iPhone新机型 用户买账吗?
- 苹果上线了全新的「隐私」网站,这恐怕是你不想关心却不得不关心的事
- 智能手机哪家强?iOS设备故障率整体低于安卓机,三星更容易坏
- “猜画小歌”的一些细节和思考
- 数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?
- 作为程序员,我的两次印象深刻的傻眼时刻
- iOS中堆和栈的使用方法
- iOS下的图片处理与性能优化
- 大数据“杀熟”新玩法 还是苹果套路深
- MySQL数据库MVCC多版本并发控制简介
- ORACLE GOLDENGATE的主要组件详解
- SQL Server 2008连接数据库引擎的驱动和方式
- 关于SQL Server 2008数据货场的几点介绍
- MyEclipse连接SQL Server 2008数据库的操作方法
- 关于GoldenGate目录的详细解释
- 影响SQL Server数据库访问速度的因素总结及优化方案
- Oracle数据库访谈之最年轻的OCM访谈
- 全文内容推荐引擎之中文分词
- 适合初学者的MySQL学习笔记之ORDER BY子句使用详解
- 适合初学者的MySQL学习笔记之SELECT语句使用详解