如何在Linux上将HTML页面转化成png图片
将一个特定页面抓取为一张png图片的最简单的方法是使用CutyCapt,这是一种在Linux下的方便地将HTML网页转化成矢量图形和位图图像格式的命令行工具(比如,SVG, PDF, PS, PNG, JPEG, TIFF, GIF)。CutyCapt内部使用WebKit渲染引擎来导出网页渲染输出到图片文件中。它使用Qt构建,CutyCapt实际上是一个也可以在Windows上使用的跨平台应用。(译注:也有一个基于IE内核的 IECapt 可以作此用途)
在本篇教程中,我会描述如何将一个HTML网页使用CutyCapt转化成png图片。
在Linux上安装 CutyCapt
这是在特定Linux发行版上的安装命令。
在Debian, Ubuntu 或者 Linux Mint 安装 CutyCapt
- $ sudo apt-get install cutycapt
在Fedora上安装 CutyCapt
- $ sudo yum install subversion qt-devel qtwebkit-devel gcc-c++ make
- $ svn co svn://svn.code.sf.net/p/cutycapt/code/ cutycapt
- $ cd cutycapt/CutyCapt
在Fedora上编译前,你需要在源码上打上补丁。
使用文本编辑器打开CutyCapt.hpp,并且加入在文件的开头加上下面的两行。
- #include
- #include
最后,如下编译并安装CutyCapt。
- $ qmake-qt4
- $ make
- $ sudo cp CutyCapt /usr/local/bin/cutycapt
在CentOS 或者 RHEL安装 CutyCapt
首先在你的Linux上启用EPEL仓库。接着和在Fedora上一样使用相同的步骤编译安装。
使用CutyCapt将 HTML 转化成 PNG
将一个HTML页面截图成一个png图片,只要使用下面的格式运行CutyCapt。
- $ cutycapt --url=http://www.cnn.com --out=cnn.png
要将HTML页面保存成不同的格式(比如,PDF),只要适当地指定输出文件。
- $ cutycapt --url=http://www.cnn.com --out=cnn.pdf
下图显示了CutyCapt命令选项。
在一台不含X的服务器上使用CutyCapt将HTML转换成PNG
虽然CutyCapt是一个命令行工具,但是它需要X服务运行。如果你尝试在不含X服务的机器上运行,你会得到下面这个错误:
- cutycapt: cannot connect to X server :0
如果你要不含X的服务器上运行CutyCapt,你可以在服务器上安装Xvfb(轻量级“假的”X11 服务)。这样CutyCapt就不会报错了。
要在Debian, Ubuntu 或者 Linux Mint 上安装Xvfb:
- $ sudo apt-get install xvfb
要在Fedora, CentOS 或者 RHEL 上安装Xvfb:
- $ sudo yum install xvfb
在安装Xvfb之后,接下来像这样运行CutyCapt。
- $ xvfb-run --server-args="-screen 0, 1280x1200x24" cutycapt --url=http://www.cnn.com --out=cnn.png
它首先会运行Xbfb服务,接着使用CutyCapt来抓取网页。因此它可能会花费更长的时间。如果你想要截图多张截图,你可能事先需要将Xvfb作为后台守护进程启动。
原文发布时间为:2014-03-18
本文来自云栖社区合作伙伴“Linux中国”
相关文章
- 在 Go 里用 CGO?这 7 个问题你要关注!
- 9款优秀的去中心化通讯软件 Matrix 的客户端
- 求职数据分析,项目经验该怎么写
- 在OKR中,我看到了数据驱动业务的未来
- 火山引擎云原生大数据在金融行业的实践
- OpenHarmony富设备移植指南(二)—从postmarketOS获取移植资源
- 《数据成熟度指数》报告:64%的企业领袖认为大多数员工“不懂数据”
- OpenHarmony 小型系统兼容性测试指南
- 肯睿中国(Cloudera):2023年企业数字战略三大趋势预测
- 适用于 Linux 的十大命令行游戏
- GNOME 截图工具的新旧截图方式
- System76 即将推出的 COSMIC 桌面正在酝酿大变化
- 2GB 内存 8GB 存储即可流畅运行,Windows 11 极致精简版系统 Tiny11 发布
- 迎接 ecode:一个即将推出的具有全新图形用户界面框架的现代、轻量级代码编辑器
- loongarch架构介绍(三)—地址翻译
- Go 语言怎么解决编译器错误“err is shadowed during return”?
- 敏捷:可能被开发人员遗忘的部分
- Denodo预测2023年数据管理和分析的未来
- 利用数据推动可持续发展
- 在 Vue3 中实现 React 原生 Hooks(useState、useEffect),深入理解 React Hooks 的