python获取公募基金二季度观点
Python 获取 基金 观点 二季度
2023-06-13 09:18:13 时间
昨天写了半天今天打开发现没存上,心态崩了,再来一遍。
目前公募基金2季度的报告基本都已经发完了,所以这次说下怎么用python获取2季度的观点。思路和之前年报观点部分差不多。季报有的基金经理会写的极简,有的还是劳模风。比如下面这个写了两页多的
代码基本上参考之前这两篇,根据季报的格式做微调,点击可跳转。
调整的地方有两个,自己手动调下即可
一个是爬虫部分getpdfurl函数里,category参数
之前取值是category_ndbg_jjgg,这次改成category_jdbg_jjgg,中间部分分别是年度报告和季度报告的缩写,就是这样简单。
改完了把时间区间调整到二季度结束之后,运行,就可以获取到所有的,最后一个参数是上面说的category的中间部分。
运行之后能获取到五千多条季报记录,最后一列是pdf的网站。
根据这个网址,再去爬虫获取pdf,爬pdf的代码 不用调整。因为实在太多了,这里我只爬了股票型和偏股混合型的基金里规模>50亿的这部分,爬下来有七十来份,也不是很全,主要是网站只能获取前100页记录,所以上面这些记录并不是全部的,有缺失。 这部分要优化的话可以一个一个基金分别去爬,这个代码第一篇推文里也有,可以自己调一调,写个循环就可。
爬下来之后从pdf获取文本部分,看几篇季报会发现格式和年报有区别,季报里面观点部分的小标题和年报不一样
另外季报也没有目录,所以获取文本部分的函数需要调整下,调整后是这样的
最后爬下来是这样的
因为代码调整不多,就不发了,自己动手,丰衣足食。
相关文章
- pycharm python解释器找不到,pycharm找不到解释器怎么办[通俗易懂]
- pycharm配置python运行环境_C中调用Python
- mt4 python_一个使用Python自动化交易外汇MT4脚本实现「建议收藏」
- python读取文件如何去除空格_python读取txt文件时怎么去掉空格
- 终于来了, 彭涛Python 爬虫训练营 !爬虫福利倒计时,速度,下周涨价!
- aic准则python_Python数据科学:线性回归
- 非常易于理解的超简单图广度优先遍历、深度优先遍历算法python实现
- python安装不了whl文件_Python安装whl文件过程图解
- python之多线程
- python语言一般用于什么_PYthon
- python数据分析、可视化、Scikit-learn、数据科学、机器学习、深度学习的区别2021.8.17
- Python编程 变量与常量
- 【说站】python列表元素的获取和查看
- 【说站】python敏感词替换
- 【说站】python操作xml的两种方法
- 【说站】python函数形参如何设置默认值
- python的特点和优势_Java与Python异同
- python中if判断语句的用法_Python if判断语句的用法详细介绍[通俗易懂]
- 初学者java编程软件_编写python的软件
- Python获取秒级时间戳与毫秒级时间戳的方法[通俗易懂]
- Python基础(十六):函数的初步认识
- KG4Py:Python代码知识图谱和语义搜索的工具包
- Python Selenium 库使用技巧
- 通过Python爬虫获取【小说网站GUI】数据,保姆级教学
- Python错误:“数据库引擎找不到输入表或查询”的一种可能情况
- python多进程编程-进程池的使用(一)
- python-Python与SQLite数据库-SQLite数据库的基本知识(二)
- Python使用platform库获取系统信息:操作系统信息、硬件信息、python环境信息
- Python list列表详解
- Python操作MongoDB数据库(简明版)
- Linux中如何离开Python环境(linux怎么退出python)
- python使用循环实现批量创建文件夹示例
- Python获取远程文件大小的函数代码分享