文件整理利器,HTML快速转换为简洁的MD文件
2023-09-11 14:18:26 时间
HTML和Markdown是两种非常重要的格式。HTML是用于创建网页的格式,而Markdown则是一种简单易读的文本格式,用于将文本转换为HTML。
如果正在寻找一种方法来将HTML文件转换为Markdown文件,那么可以使用Python来轻松完成这项任务。
# coding:utf-8
__author__ = 'Mr.数据杨'
__explain__ = '1.html文件转换MD文件'
import html2text as ht
def html_2_text(input_file, output_file):
text_maker = ht.HTML2Text()
# 读取html格式文件
with open(input_file, 'r', encoding='UTF-8') as f:
htmlpage = f.read()
# 处理html格式文件中的内容
text = text_maker.handle(htmlpage)
# 写入处理后的内容
with open(output_file, 'w', encoding='UTF-8') as f:
f.write(text)
if __name__ == "__main__":
input_file = "test.html"
output_file = "result.md"
html_2_text(input_file, output_file)
相关文章
- JSON转换为数组 但读取JSON的顺序目前没法保证
- 进制转换
- Word控件Spire.Doc 转换教程(十五):在 C# 中将 HTML 文件转换为 PDF 和 XPS
- Word处理控件Aspose.Words功能演示:在 Python 中将 TXT 文件转换为 PDF
- iconv 文件编码相互转换
- 数仓工具—Hive语法之行列转换(18)
- 用tolower()和toupper()来实现对string进行大小写转换
- spring mvc 使用及json 日期转换解决方案
- Python ASCII码与字符相互转换
- 将VOC数据格式转换为YOLO数据格式(附源码)
- RGB,CMYK,HSB各种颜色表示的转换 C#语言
- mount nfs 各版本之间的转换
- 有没有一个在线工具可以将Python代码转换为Java代码?
- AI教程之Meta 的新 AI 将文本转换为视频
- 2021-06-26 将dos格式文件转换成unix格式,即windows文件转换为linux下的文件
- linu 把文件中的字母小写转换为大写,大写转换为小写awk toupper tolower
- python docx 读取word文件 转换药典目录
- python pdf 文件,流转换
- ASCII,UTF-8,Unicode字符串相互转换
- pdf2docx 转换 pdf 为 word文件
- 【Python】pandas的使用——CSV文件、Excel文件、TXT文件之间的转换
- Python实现温度转换