Atitit.jsou html转换纯文本 java c# php
Atitit.jsou html转换纯文本 java c# php
1. 原理<p> <h> <li><div> 等lable转换为回车1
1. 原理<p> <h> <li><div> 等lable转换为回车
"'&(quot|#34);'i", // 替换 HTML 实体
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://www.cnblogs.com/attilax/
public void head(Node node, int depth) {
String name = node.nodeName();
if (node instanceof TextNode)
append(((TextNode) node).text());
else if (name.equals("li"))
append("\n * ");
}
public void tail(Node node, int depth) {
String name = node.nodeName();
if (name.equals("br"))
append("\n");
else if (StringUtil.in(name, new String[] { "p", "h1", "h2", "h3",
"h4", "h5" }))
append("\n\n");
else if (name.equals("a"))
append(String.format(" <%s>",
new Object[] { node.absUrl("href") }));
}
private void append(String text)
2. 调用
public static void main(String[] args) {
pathx.isWebPathMode = true;
String f = pathx.classPath() + "/com/attilax/cms/cms_tmplt.html";
String txt = filex.read(f);
Document doc = Jsoup.parse(txt);
// Document doc = Jsoup.connect(url).get();
String plainText;
HtmlToPlainText formatter = new HtmlToPlainText();
plainText = formatter.getPlainText(doc);
System.out.println(plainText);
String x = "工作时间:08:00-22:00\r\n性别要求:男女不限";
x = plainText;
@SuppressWarnings("rawtypes")
Map m = new RowParser().parse(x);
System.out.println(AtiJson.toJson(m));
System.out.println("---f");
}
3. Php的实现strip_tags
string strip_tags(string str[,string allowable_tags])
4. 参考
Jsoup代码解读之一-概述 - ImportNew.htm
PHP将HTML转换成纯文本内容实例-Php常用代码-Php教程-壹聚教程网.htm
相关文章
- javascript 与 PHP 通信加密,使用AES 128 CBC no padding,以及ios,java,c#文章例子
- C#和JAVA的RSA密钥、公钥转换
- 将Facade装饰模式的代码由C#转为JAVA
- C#DES加密,JavaDES解密,另转C#和Java实现Des完整代码
- C# Java间进行RSA加密解密交互(三)
- java和C#异常处理的差异
- Atitit.常见的异常分类 目录 1. 双元分类法1 1.1. 按照语言分 java js c# php等1 1.2. 通用常见异常vs 特定异常1 1.3. Runtime ex vs c
- atitit..代码生成流程图 流程图绘制解决方案 java c#.net php v2
- Atitit usbQb212 oo 面向对象封装的标准化与规范解决方案java c# php js
- Atitit.java c#.net php项目中的view复用(jsp,aspx,php的复用)
- Atitit.提升软件Web应用程序 app性能的方法原理 h5 js java c# php python android .net
- Atitit. 注册表操作查询 修改 api与工具总结 java c# php js python 病毒木马的原理
- Atitit.跨语言异常转换机制 java c# php到js的异常转换
- Atitit。Cas机制 软件开发 编程语言 无锁机制 java c# php
- atitit.木马病毒webshell的原理and设计 java c# .net php.
- Atitit.获取approot api 应用根路径 java c#.net php asp
- atitit.复合变量,也就是类似$$a的变量的原理与实现 java c#.net php js
- Atitit. 数据约束 校验 原理理论与 架构设计 理念模式java php c#.net js javascript mysql oracle
- Atitit.收银机小票打印功能的设计 java php c#.net版本
- Atitit.得到网络邻居列表java php c#.net python
- Atitit. 数据约束 校验 原理理论与 架构设计 理念模式java php c#.net js javascript mysql oracle
- Atitit.加密算法 des aes 各个语言不同的原理与解决方案java php c#