您现在的位置是：首页 > 数据库

当前栏目

用urllib库几行代码实现最简单爬虫-java爬虫代码示例

数据库数据库 HTML 代码

2023-04-18 14:45:37 时间

“”” 使用urllib.request()请求一个网页内容，并且把内容打印出来。

“””

from urllib import request

import chardet

if __name__ == ‘__main__’:

# 有的网站url使用不了 url = “https://www.cnblogs.com/gshelldon/p/13332798.html”

# 打开url把内容赋值给rsp rsp = request.urlopen(url)

# 存取到内存当中是bytes流，使用read方法把rsp的内容读取出来，赋值给变量html。 html = rsp.read()

# 使用decode解码成我们能够看懂的格式。 # print(type(html)) # 查看返回的格式

html = html.decode(‘utf-8’) # 默认的是utf-8 print(html)

返回的内容是html格式的文本

D:ProgramDataAnaconda3envsspiderpython.exe D:/爬虫/v1-最简单的爬虫.py <!DOCTYPE html> <html lang=”zh-cn”> <head> <meta charset=”utf-8″ /> <meta name=”viewport” content=”width=device-width, initial-scale=1.0″ /> <meta name=”referrer” content=”origin” /> <meta property=”og:description” content=”nginx 动静分离不需要运维来做，开发做的。动态请求：该请求会调用数据库中的数据。静态请求：用户请求不会调用数据库。动态页面：后端开发写的需要调用数据库的页面(python、java、C、p” /> <meta http-equiv=”Cache-Control” content=”no-transform” /> 省略。。。。。。。

猜你喜欢

Jease 2.6发布 Java开源内容框架
EasyCVR对接华为iVS订阅摄像机和用户变更请求接口介绍
JVM调优总结：反思
【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
JVM调优总结：调优方法
前端面试【JavaScript】— typeof 是否能正确判断类型？
JVM调优总结：新一代的垃圾回收算法
前端面试【JavaScript】— instanceof 能否判断基本数据类型？
JVM调优总结：典型配置举例
前端面试【JavaScript】— 能不能手动实现一下 instanceof 的功能？
前端面试【JavaScript】— Object.is和=== 有什么区别？
JVM调优总结：分代垃圾回收详述
前端面试【JavaScript】— JS中类型转换有哪几种？
WPF开发入门尝试
前端面试【JavaScript】— == 和 ===有什么区别？
一个Java程序员对2011年的回顾
前端面试【JavaScript】— 对象转原始类型是根据什么流程运行的？
JVM调优总结：垃圾回收面临的问题
直接在代码里面对list集合进行分页
JVM调优总结：基本垃圾回收算法

zl程序教程

当前栏目

用urllib库几行代码实现最简单爬虫-java爬虫代码示例

返回的内容是html格式的文本

相关文章