zl程序教程

您现在的位置是:首页 >  Python

当前栏目

python爬虫爬取QQ号

2023-02-26 10:21:39 时间

python爬虫爬取QQ号

这个爬虫是拿来练手的,可以爬取网络中的QQ号,然后存储到本地。

(福利推荐:阿里云、腾讯云、华为云服务器最新限时优惠活动,云服务器1核2G仅88元/年、2核4G仅698元/3年,点击这里立即抢购>>>

import urllib.request
import ssl
import re
import os
from collections import deque #导入队列库

def writeFileBytes(htmlBytes,topath):

with open(topath,'wb') as f:     f.write(htmlBytes)

def writeFileStr(htmlBytes,topath):

with open(topath, 'w') as f:     f.write(str(htmlBytes)) 

def QQCrawler(url, topath):

headers = {     "User-Agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)" }          #修改一下浏览器表头(User-Agent) req = urllib.request.Request(url, headers=headers)  # 请求体 context = ssl._create_unverified_context()          #加上此行可以爬取https格式 response = urllib.request.urlopen(req, context=context) HTMLStr = response.read() # writeFileBytes(HTMLStr,r"G:python代码爬虫QQ号.html?userCode=wrvvs1rm") # writeFileStr(HTMLStr,r"G:python代码爬虫QQ号.txt")  htmlStr=str(HTMLStr)  pat=r'b(([w-]+://?|www[.])[^s()<>]+(?:[wd]+[wd]+|([^[:punct:]s]|/)))'   #网址的正则表达式 re_url=re.compile(pat) urlsList=re_url.findall(htmlStr) urlsList = list(set(urlsList))   #找到所有的QQ pat=r"[1-9][d]{5,9}"        #QQ号的正则表达式 re_q=re.compile(pat)         #编译 qqList=re_q.findall(htmlStr) qqList=list(set(qqList))   #过滤重复QQ号 f=open(topath,'a') #写入文件 for qq in qqList:     f.write(qq+"n") f.close()   return urlsList  #返回一个存储这个网页中的超链接   

队列,得到上一页网址,然后加入队列,爬取每个网页的QQ号
def center(url,topath):

queue=deque() queue.append(url) while len(queue)!=0:     targetUrl=queue.popleft()     urlList=QQCrawler(targetUrl, path)      for item in urlList:         tempUrl=item[0]         queue.append(tempUrl) 

url = r”https” #爬取链接
path = r”G:python代码爬虫QQ号.txt” #存储路径
QQCrawler(url,path)
center(url,path)
还存在一些问题:比如https://www.fgba.net/,url的正则表达式存在问题,不能匹配所有的链接。运行时也存在问题,爬取到本地的数据只有2M多,程序就停止运行了。

python爬虫爬取QQ号


本站部分内容转载自网络,版权属于原作者所有,如有异议请联系QQ153890879修改或删除,谢谢!
转载请注明原文链接:python爬虫爬取QQ号

你还在原价购买阿里云、腾讯云、华为云、天翼云产品?那就亏大啦!现在申请成为四大品牌云厂商VIP用户,可以3折优惠价购买云服务器等云产品,并且可享四大云服务商产品终身VIP优惠价,还等什么?赶紧点击下面对应链接免费申请VIP客户吧:

1、点击这里立即申请成为腾讯云VIP客户

2、点击这里立即注册成为天翼云VIP客户

3、点击这里立即申请成为华为云VIP客户

4、点击这里立享阿里云产品终身VIP优惠价

喜欢 (0)
[[email protected]]
分享 (0)