java将html转换为纯文本的代码详解编程语言
2023-06-13 09:20:30 时间
ParserDelegator delegator = new ParserDelegator();
// the third parameter is TRUE to ignore charset directive
delegator.parse(in, this, Boolean.TRUE);
public void handleText(char[] text, int pos) {
s.append(text);
public String getText() {
return s.toString();
public static void main (String[] args) {
try {
// the HTML to convert
FileReader in = new FileReader("java-new.html");
Html2Text parser = new Html2Text();
parser.parse(in);
in.close();
System.out.println(parser.getText());
catch (Exception e) {
e.printStackTrace();
}
原创文章,作者:Maggie-Hunter,如若转载,请注明出处:https://blog.ytso.com/10880.html
cjava相关文章
- java JSON使用之JSONObject、JSONArray与Object的转换
- java软件工程师是做什么的_JAVA软件工程师是做什么的?
- java 环境变量配置_java环境变量的详细配置「建议收藏」
- java jersey使用总结_Java Jersey2使用总结
- javascript html转换成markdown,如何使用Turndown使用JavaScript将HTML转换为Markdown[通俗易懂]
- java——String中的大小写字母的转换 substring()方法的介绍
- java字符串转换为json对象6_Json对象与Json字符串的转化、JSON字符串与Java对象的转换…
- Java截取字符串方法_java通过split截取字符串
- java webservice接口开发教程_JAVA入门教程
- 【错误记录】生成 Java 文档错误 ( Xxx.java:xx: 错误: 编码GBK的不可映射字符 )
- 字符串 java字符串编码转换处理类详解编程语言
- 银联网关支付,退款java实现详解编程语言
- Java NIO之Charset类字符编码对象详解编程语言
- 初识Java NIO详解编程语言
- Linux环境下编译Java程序的指南(linux编译java)
- java实现图片与base64字符串之间的转换详解编程语言
- 服务器使用Java进行Linux服务器监控(java监控linux)
- Java调试Linux:探索新的技术可能性(java调试Linux)
- 失效Java应用Redis实现缓存失效的优化(redisjava过期)
- Linux下安装Java 开发环境指南(linux装java环境)
- 挑战未来:学习Linux与Java(学linux还是java)
- 实现高并发:Java利用Redis秒杀成功(java秒杀redis)
- 我为什么使用 Java
- Java实现Linux:跨平台解决方案(java 实现linux)
- Java数据库之MySQL学习使用教程(mysql中java教程)
- Java革命Oracle旗下的程序设计利器(java简介oracle)
- [JAVA]十四种Java开发工具点评
- Java类变量和成员变量初始化过程的应用介绍