python抽取指定url页面的title方法
今天简单使用了一下python的re模块和lxml模块,分别利用的它们提供的正则表达式和xpath来解析页面源码从中提取所需的title,xpath在完成这样的小任务上效率非常好,在这里之所以又使用了一下正则表达式是因为xpath在处理一些特殊的页面的时候会出现乱码的情况,当然这不是xpath的原因,而是页面本身编码,跟utf-8转码之间有冲突所致,
这里看代码:
# !/usr/bin/python
#-*-coding:utf-8-*-
'''
功能:抽取指定url的页面内容中的title
'''
import re
import chardet
import urllib
from lxml import etree
def utf8_transfer(strs):
def get_title_xpath(Html):
def get_title(Html):
if __name__ == '__main__':
下面是结果:
百度一下,你就知道
百度一下,你就知道
简单的小实践,继续学习,欢迎交流。
以上这篇python抽取指定url页面的title方法就是小编分享给大家的全部内容了,希望能给大家一个参考
相关文章
- python求逆矩阵的方法,Python 如何求矩阵的逆「建议收藏」
- pip安装的包pycharm识别不了_手机上的python安装第三方库
- pycharm安装python3.6_python安装教程
- 在pycharm中如何新建Python文件?_github下载的python源码项目怎么用
- Python多线程通信_python socket多线程
- Python编码规范
- python实现矩阵的转置_Python实现矩阵转置的方法分析
- 【说站】python如何实现自定义异常类
- python标识符命名规则和要求_python必背入门代码
- python中的cookielib的使用方法
- 【愚公系列】2023年02月 Python工具集合-cutecharts图表可视化
- python-Python与SQLite数据库-处理SQLite查询结果(一)
- linux保留旧版本python,安装python3详解程序员
- python多线程有几种实现方法详解编程语言
- python获得本机本地ip地址的方法汇总详解编程语言
- Python测试Sqlite代码详解编程语言
- Bokeh v0.12.6dev3 发布,一个 Python 交互式可视化库详解编程语言
- Python连接MySQL数据库:初学者指南(python入mysql)
- Python对小数进行除法运算的正确方法示例