Python脚本抓取京东手机的配置信息
2023-09-11 14:14:04 时间
以下代码是使用python抓取京东小米8手机的配置信息
首先找到小米8商品的链接:https://item.jd.com/7437788.html
然后找到其配置信息的标签,我们找到其配置信息的标签为 <div class="Ptable">
然后再分析其配置信息的页面的规律,我们发现都是dl中包含了dt和dd,而一个dt对应的一个dd,dt对应的是参数,dd对应的是参数具体的值
下面是源代码
import requests
from bs4 import BeautifulSoup
from pandas import Series
from pandas import DataFrame
response=requests.get("https://item.jd.com/7437788.html")
html=response.text
soup=BeautifulSoup(html,"html.parser")
divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签
data=DataFrame(columns=["参数","值"]) #定义一个二元的DataFrame
dls=divSoup.find_all("dl")
for dl in dls:
dts=dl.find_all("dt")
dds=dl.find_all("dd")
if len(dts)==len(dds):
for i in range(len(dts)):
f=dts[i].getText();
p=dds[i].getText();
data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);
print(data)
这是最终抓取到的配置信息,一共有64行,这里我就不一一列举出来了
相关文章
- python 自动化审计
- Eclipse Kepler SR2 + Python 3.4 + JDK7+Pydev3.4 搭建 python 开发环境(MAC)
- python中yield关键字方法详解
- 每天一个python小知识——如何在Python 3中转换数据类型
- python argparse参数配置详解
- 使用python脚本Telnet 华为交换机备份配置
- Python爬虫技术--基础篇--错误,调试和测试(下)
- 【Python】【爬虫】IP代理/IP限制/IP被封/通过接口调用查询本机IP
- vscode (Visual Studio Code) 配置Python 虚拟环境
- 高性能二分查找算法Python精简版
- 《树莓派Python编程入门与实战》——第1章 配置树莓派
- 基于 Python + redis + flask 的在线聊天室【100010386】
- Python实时语音识别控制
- 配置Sublime Text2的python运行环境(Sublime Text 3也类似)
- Python新闻网站项目-2.Scrapy爬虫的配置和数据抓取
- python调用C++之pybind11入门(相互调用)
- 《Python自动化运维:技术与最佳实践》一2.4 探测Web服务质量方法
- python安装与配置
- Python requests 报错解决集锦
- Python迭代器和生成器
- SublimeText3配置Python编译环境
- Python机器学习:使用Pandas进行探索性数据分析 Ⅰ
- Windows 64bit下Python环境配置与集成IDE PyCharm