您现在的位置是：首页 > 后端

当前栏目

Python xml 解析百度糯米信息

Python 百度 XML 解析信息

2023-09-27 14:27:40 时间

先利用爬虫利用百度糯米提供的api来采集北京当天的团购信息，保存为numi.html

import xml.etree.ElementTree as ET
import os

class Nuomi():

   def __init__(self):

       self.numi=[]
   def Parse(self,filepath):

       tree=ET.parse(filepath)
       root =tree.getroot()
       for url in root.iter('url'):
           nuomi_lei={}
           data=url.find('data')
           if data is not None:
               display=data.find('display')
               if display is not None:
                   try:
                       nuomi_lei['title']=display.find('title').text
                   except Exception as e:
                       print("No title")
                   try:
                       nuomi_lei['businessTitle']=display.find('businessTitle').text
                   except Exception as e:
                       print ("No businessTitle")
                   try:
                       nuomi_lei['value'] =display.find('value').text
                   except Exception as e:
                       print ("No value")
                   try:
                       nuomi_lei['price']=float(display.find('price').text)
                   except Exception as e:
                       print("No pire")
                   self.numi.append(nuomi_lei)
       return(self.numi)


if __name__ == '__main__':

   nuomi=Nuomi()
   date=nuomi.Parse('numi.html')
   print(len(date))

猜你喜欢

Spring ApplicationListener使用方法及问题
javaScript 04 对象的使用
你应该知道的 5 个 Docker 工具
禁止body滚动允许div滚动防微信露底
ES6 学习网站
纯干货讲解财务三大报表，值得收藏
android 打包流程
UGUI 底图自适应文本框大小
Suggestion: add ‘tools:replace=“android:configChanges“ 两个jar包之间的冲突
Netty源码分析（二）----- ServerBootstrap
Python Module_subprocess_调用 Powershell
Oracle 11g client的安装和配置。
C++注释规范
asterisk todo
jeecg查询分页
centOS 6.5关闭防火墙步骤
2022-03-17 redis-operator-redis单点-redis配置记录
大数据是如何颠覆农业生产的?
HDU 4832(DP+计数问题)
iOS Json转换模型库：YYModel

相关主题

python 乱码
python的with语句
python批量下载
python input函数
Python及Pycharm安装
python 线程模块

zl程序教程

当前栏目

Python xml 解析百度糯米信息

相关文章