Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法
2023-03-20 15:36:30 时间
实例为从我文章中读取标题。
通过 class 属性锁定标题元素,把匹配的内容打印出来。
下面是源码:
package com.test.test;
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
public class WebHtmlTest {
public static void main(String[] args) throws IOException {
/*
作用:从url中读取web页面的内容
*/
String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";
// 连接的超时时间
System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
// 读取数据的超时时间
System.setProperty("sun.net.client.defaultReadTimeout", "20000");
try {
URL url = new URL(html_url);
URLConnection url_connection = url.openConnection();
InputStream input_stream = url_connection.getInputStream();
InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
BufferedReader html_reader = new BufferedReader(input_stream_reader);
String html_reader_line = null;
// 读取html内容
while ((html_reader_line = html_reader.readLine()) != null) {
if(html_reader_line.contains("class="title-article"")) {
System.out.println(html_reader_line);
}
}
// 关闭创建的对象
html_reader.close();
input_stream_reader.close();
input_stream.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
相关文章
- 深入探讨Java中的异常与错误处理
- 研究学习Kotlin的一些方法
- 数据显示Java热度持续下落,日子屈指可数?
- 2017年5月编程语言排行榜:Java与C语言优势正开始缩小
- Java多线程之内置锁与显示锁
- Java线程池的理论与实践
- 白话阿里巴巴Java开发手册(编程规约)
- 关于Java你不知道的十件事
- Java服务化系统线上应急和技术攻关,你必须掌握的Linux命令
- Java实现高斯模糊和图像的空间卷积
- Java阻塞队列实现原理分析
- NPM使用技巧
- Node.js对Java开发者而言是什么?
- Java反射机制应用实践
- 理解RxJava中的Single和Completable
- 2017年你不能错过的Java类库
- 大规模集群下的Hadoop NameNode
- 从源码解密Spark内存管理
- 2017年3月编程语言排行榜:Swift首次进入前十
- JVM热点技术:Java类的加载机制