您现在的位置是：首页 > 前端

当前栏目

16.ajax_case08

AJAX 16

2023-09-11 14:21:24 时间

# 抓取简书博客总阅读量
# https://www.jianshu.com/u/130f76596b02
import requests
import json
import re
from lxml import etree

header = {
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 '
    '(KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}

def get_all_article_links():
    links_list = []
    for i in range(1, 22):
        url = 'https://www.jianshu.com/u/130f76596b02?order_by=shared_at&page={}'.format(
            i)
        response = requests.get(url,
                                headers=header,
                                timeout=5
                                )
        tree = etree.HTML(response.text)
        article_links = tree.xpath(
            '//div[@class="content"]/a[@class="title"]/@href')
        for item in article_links:
            article_link = 'https://www.jianshu.com' + item
            links_list.append(article_link)
    return links_list

def get_read_num():
    num_list = []
    links_list = get_all_article_links()
    for url in set(links_list):
        response = requests.get(url,
                                headers=header,
                                timeout=5
                                )

        content = response.text
        read_num_pattern = re.compile(r'"views_count":\d+')
        read_num = int(read_num_pattern.findall(content)[0].split(':')[-1])
        print(read_num)
        num_list.append(read_num)
    return num_list

# total_read = 0
# for num in get_read_num():
#     total_read += num
# read_num_list = get_read_num()
# print('总阅读量 =', sum(read_num_list))

猜你喜欢

大杂烩 -- 四种生成和解析XML文档的方法详解
921. Minimum Add to Make Parentheses Valid
VS2017 调试 Unity3D 脚本
RESTful之HTTP请求类型GET，POST
【测试的艺术】报告
SAP MM GR-based IV, 无GR不能IV？
springboot获取application.yml中的配置信息
C#多线程
从云图计划看浪潮云野心
物联网火了，物联网企业为何却融不到资
QT工具——国际化工具
西门子的统一通信解决之道
【bzoj3585/bzoj3339】mex/Rmq Problem 莫队算法+分块
Vue+ElementUI 导航组件
process.env.NODE_ENV理解
C/C++从路径得到目录名文件名
Flask之异常处理

相关主题

jquery的ajax例子
jquery ajax例子
Ajax与Json
ajax的工作原理
什么是Ajax？
什么是 Ajax ？
Ajax(五)
jQuery（五）Ajax、跨域
JQuery Ajax详解编程语言
jQuery的ajax问题
jQuery Ajax编程
让Ajax更简单
ajax异步请求302
ajax教程
ajax 笔记

zl程序教程

当前栏目

16.ajax_case08

相关文章