您现在的位置是：首页 > .Net

当前栏目

stars-one的原创工具——博客园备份工具

2023-02-18 16:39:52 时间

前言

写了两年多的博客了，我想整理我的博客，问题是，得一个个打开，之后复制粘贴，嫌这样太麻烦，于是便找到了博客园的备份功能。

但是这个备份功能下载下来的只是一个xml文件，我想把每一篇博文都转为一个md文件，于是便有了这个Java小工具。

工具下载

GitHub下载(似乎需要FQ，不然下载速度很慢）

4.0版本下载

修复了标签关键字不能带空格小bug

新增加目录导航追加功能

界面预览:

使用说明

从博客园上下载备份的xml文件将本项目下载，打开run.bat,输入前面下载的xml文件的地址，即会在xml文件的同目录生成一个博客园的文件夹，里面存放MD文件和Html文件

程序讲解

涉及知识

IO流
xml解析

xml文件分析

从博客园下载的xml备份文件，格式大概是这样的

<channel>
	<title></title>
	<link></link>
	<description<</description>
	<language></language>
	<lastBuildDate></lastBuildDate>
	<pubDate></pubDate>
	<ttl></ttl>
	<item></item>
	<item></item>
	...
</channel>

其中的item就是我们博客中每一篇博文

item结构

<item>
	<title></title>
	<link></link>
	<dc:creator></dc:creator>
	<author></author>
	<pubDate></pubDate>
	<guid></guid>
	<description></description>
<item>

item结点之下还有子结点
title是我们的博文标题

link则是我们博文对应的链接

description则是我们博客的内容

	NodeList itemLists = document.getElementsByTagName("item");//获得所有的item结点
	for (int i = 0; i < itemLists.getLength(); i++) {
		NodeList list = itemLists.item(i).getChildNodes();//获得item结点之下的全部结点，有7个，下标从0开始
		String title = list.item(0).getTextContent();//第一个结点内容是标题
		String link = list.item(1).getTextContent();//第二个结点内容是链接
		String description = list.item(6).getTextContent();
		fileWrite(title,link,description);
	}

PS：这里需要注意到是，description里面获取的内容我们查看的时候发现是下面这样的代码

这个CDATA其实是个xml的标准标签，表明这里面的内容都是文本（上面的也就是测试和句号才是内容，解析的时候会忽略掉两个中括号）

区分md文件和html文件

如果是md文件，开头不可能出现<这个符号，如果是html文件，因为要使用到各种标签，p,h,div等标签，肯定开头是有<这个符号的

html文件转md文件

如果想不想要html文件，想要md文件的话，就得手动去整理格式，可以先使用在线的工具将html文件转为md格式，这个百度一下就有工具了，不过还得慢慢整理一下，格式转换过来不一定符合排版，我们得手动地去排个版。

猜你喜欢

由一个订单推送想到了ObservableCollection的神奇用法
用MsmqBinding投送message出现的一个灵异事件【第二篇】
CSS之旅——第三站强大的伪选择器
CSS之旅——第二站如何更深入的理解各种选择器
CSS之旅——第一站为什么要用CSS
记录一些在用wcf的过程中走过的泥巴路【第一篇】
asp.net mvc 之旅—— 第二站窥探Controller下的各种Result
asp.net mvc 之旅—— 第一站从简单的razor入手
Sql Server之旅——终点站 nolock引发的三级事件的一些思考
Sql Server之旅——第十四站深入的探讨锁机制
Sql Server之旅——第十三站对锁的初步认识
Sql Server之旅——第十二站 sqltext的参数化处理
Sql Server之旅——第十一站简单说说sqlserver的执行计划
Sql Server之旅——第十站看看DML操作对索引的影响
如何在windows下成功的编译和安装python组件hyperscan
CNCF Serverless工作流社区携手华为云FunctionGraph，开拓Serverless编排新时代
几种如何判断环境是否连上网方法！推荐最后一种
JAVA只要掌握内部类，多继承和单继承都不是问题
带你掌握Redis数据类型：string和Hash
深度剖析数仓CN增量备份技术

zl程序教程