您现在的位置是：首页 > 前端

当前栏目

使用selenium的方式获取网页中图片的链接和网页的链接，来判断是否是死链（二）

网页链接获取方式图片判断 selenium 是否是

2023-09-11 14:14:15 时间

上一篇使用Java正则表达式来判断和获取图片的链接以及跳转的网址，这篇使用selenium的自带的API（getAttribute）来获取网页中指定的内容

实现内容：获取下面所有图片的链接地址以及跳转地址，使用get请求判断是否有死链

页面内容如图：

页面的源码,需要获取页面的href后的地址，以及src后的地址，:

代码实现可以看出图片都在一个div中，实现的思想为：获取控件集合，在获取每一个li下的元素，在获取，在取出数据下的属性名的属性值

public void new_classification() throws Exception {
        op.loopGet(home, 40, 3, 60);
        op.loopClickElement("swimmer", 3, 10, explicitWaitTimeoutLoop);// 进入到某个页面
        if (driver.getCurrentUrl().contains("swimwear")) {
            List<WebElement> newimage = driver.findElements(By.xpath("//*[@id='js_proList']/ul/li"));// 图片的控件集合
            for (int i = 0; i < newimage.size(); i++) {
                String contentURL = newimage.get(i).findElement(By.xpath("p[1]/a[1]")).getAttribute("href");// 图片的跳转地址
                String imageURL = newimage.get(i).findElement(By.xpath("p[1]/a[1]/img")).getAttribute("src");// 图片的链接地址
                Pub.get(contentURL);
                System.out.println("**********************");
                Pub.get(imageURL);//get请求
            }
        } else {
            Log.logError("没有进入到new页面");
        }
    }

结果展示

如果需要使用正则表达式，查看文章：http://www.cnblogs.com/chongyou/p/7286447.html

猜你喜欢

Oracle sql查询
[转]HQL中的子查询
Linux性能优化2.1　CPU性能统计信息
[DeeplearningAI笔记]卷积神经网络3.10候选区域region proposals与R-CNN
PCIE体系结构基础和Linux PCI设备注册过程的实现
上海成立司法行政大数据实验室
iOS 原生地图（MapKit、MKMapView）轨迹渐变
第十四届蓝桥杯第二期模拟赛题解
Java并发大师Brain Goetz和Doug Lea 的中英文博客文章地址
锐捷SNMp注意：
作用域变量 var
size_t 和 size_type的区别
Java 图片压缩简版
SpringBoot监控中心
《Programming in C》读书笔记

相关主题

Bootstrap 网页1
网页下载
微信网页授权
长链接短链接
（104）网页爬虫
钉钉网页版全屏
动态链接及静态链接
静态链接和动态链接
软链接和硬链接
硬链接与符号链接
Linux硬链接与软链接
Linux硬链接，软链接
硬链接与软链接
Linux 软链接和硬链接
Linux - 硬链接与软链接
Linux 软链接和硬链接
linux软链接和硬链接
css与网页制作
网页爬虫

zl程序教程

当前栏目

使用selenium的方式获取网页中图片的链接和网页的链接，来判断是否是死链（二）

结果展示

相关文章