您现在的位置是：首页 > 其他

当前栏目

爬取天气信息，并存储到txt文件

文件存储信息 txt 爬取天气

2023-09-14 09:14:59 时间

爬取天气信息，并存储到txt文件

import requests
from bs4 import BeautifulSoup
import xpinyin


#
def getHtml(url, header=None):
    if header != None:
        res = requests.get(url, headers=header)
    else:
        res = requests.get(url)
    res.encoding = 'utf8'
    if res.status_code == 200:
        return res.text
    return None

#请求头
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36',
        'Host':'lishi.tianqi.com',
        'Accept-Encoding': "gzip, deflate, br",
        'Connection': "keep-alive",
        'cache-control': "max-age=0"}   



def getURL(city, month, year=2022):
    p = xpinyin.Pinyin()
    city = p.get_pinyin(city).replace("-", "")
    if month < 10:
        month = "0" + str(month)
    return "https://lishi.tianqi.com/" + city + "/" + str(year) + str(month) + ".html"

dic = {"晴": 0,"阴": 1,"多云": 2,"风": 3, "霾": 4, "雾":5,"小雪": 6,
       "中雪": 7, "大雪": 8,"小雨": 9,"中雨": 10,"大雨": 11,"阵雨":12,
       "暴雨":13}

citys = ["海南","晋城"]
for city in citys:
    with open(city + "2022天气数据.txt", 'w', encoding='utf8') as f:
        for m in range(1, 13):
            cnt = 1
            url = getURL(city, m)
            html = getHtml(url, headers)
            soup = BeautifulSoup(html, 'html.parser')#解析器，正则表达式
            weather_html = soup.findAll("ul", class_="thrui")[0]
            weather = weather_html.text
            weather = weather.split("\n\n")[:-1]

            for d in weather:
                if d != "":
                    dd = d.replace("\n", " ")
                    dd = dd.split(" ")
                    print(dd)
                    m = str(m)
                    dd[0] = m.rjust(2,"0")
                    dd[1] = cnt
                    cnt += 1
                    dd[3] = dd[3][:-1]
                    dd[4] = dd[4][:-1]
                    sss = dd[5]
                    sss = sss.split("转")[0]
                    sss = sss.split("到")[0]
                    #print(sss)
                    dd[5] = dic[sss]
                    #print(dd)
                    ss=str(dd[0])+" "+str(dd[1])+" "+str(dd[3])+ " "+str(dd[4])+" "+str(dd[5])+"\n"
                    #mysql.insert(str(dd[0]), str(dd[4]), str(dd[3]), str(dd[5]), city)
                    #dd=dd+"\n"
                    #print(ss)
                    f.write(ss)

猜你喜欢

借助Redis实现有效过滤过期数据（redis过滤过期数据）
【说站】10月最新版人人商城DIY版小程序源码前端+后端+数据库
C语言条件运算符(? : )的用法
地址查看Linux系统IP地址的方法（查看linuxip）
SQL Server表单：让数据形态化体验更佳（sqlserver表单）
小范围研究表明哺乳期女性接种mRNA疫苗后母乳中未发现疫苗成分
50个MySQL高级语法，让你成为数据库高手（50个高级mysql语句）
监控redis，抓取有价值的数据（监听获取redis的值）
打造独一无二的Linux终端配色方案：如何修改你的终端配色（linux终端配色）
Linux下的vi编译器：功能强大的代码编辑器（Linuxvi编译器）
与应用探索Linux分支及其应用（linux的分支）
VML的基本概念
蚂蚁与MySQL共同打造丰收之路（ant mysql）
Jquery与JS两种方法仿twitter/新浪微博高度自适应无缝滚动实现代码
“欺师灭祖”干掉918！地表最强保时捷911发布
MySQL中创建用户的方法（mysql数据库创建用户）
量子版CUDA，英伟达发布革命性QODA编程平台
论文这玩意, 也可以是这样读的啊
Oracle EM优势在何处（oracle em好用吗）
phpredis每隔30秒统计详解编程语言
在PWS上安装PHP4.0正式版

相关主题

tar 打包文件
C语言——文件
python写csv文件
php 下载文件

zl程序教程

当前栏目

爬取天气信息，并存储到txt文件

爬取天气信息，并存储到txt文件

相关文章