使用BeautifulSoup爬虫程序获取百度搜索结果的标题和url示例
2023-06-13 09:15:16 时间
熟悉Java的jsoup包的话,对于Python的BeautifulSoup库应该很容易上手。
#coding:utf-8
importsys
importurllib
importurllib2
fromBeautifulSoupimportBeautifulSoup
question_word="吃货程序员"
url="http://www.baidu.com/s?wd="+urllib.quote(question_word.decode(sys.stdin.encoding).encode("gbk"))
htmlpage=urllib2.urlopen(url).read()
soup=BeautifulSoup(htmlpage)
printlen(soup.findAll("table",{"class":"result"}))
forresult_tableinsoup.findAll("table",{"class":"result"}):
a_click=result_table.find("a")
print"-----标题----\n"+a_click.renderContents()#标题
print"----链接----\n"+str(a_click.get("href"))#链接
print"----描述----\n"+result_table.find("div",{"class":"c-abstract"}).renderContents()#描述
print
相关文章
- 百度搜索使用技巧,让搜索更高效
- 【说站】百度搜索打击盗版网文站点公告,百度开始打击盗版网文。
- LyScript 批量搜索反汇编特征
- 最优二叉搜索树问题(Java)
- WordPress 中文分词搜索
- “台湾省山西刀削面”搜索过多,百度地图宕机;BOSS直聘即将实行末位淘汰;B站回应HR称核心用户是Loser |Q资讯
- OpenAI 再丢“王炸”:ChatGPT “封印”解除,能联网、搜索了!
- 用百度搜索获取 IP 地址的归属地(已经失效)
- [PHP] 网盘搜索引擎-采集爬取百度网盘分享文件实现网盘搜索详解编程语言
- 聊天机器人遇到不懂的还能上网搜索 像极了不懂装懂时偷偷百度的我
- 聊天机器人遇到不懂的还能上网搜索 像极了不懂装懂时偷偷百度的我
- 百度自然搜索链接主动推送工具升级版代码
- 极致体验:Linux P2P搜索之旅(linuxp2p搜索)
- “东京奥运会”专题页面上线百度搜索:7月23日正式开幕
- Linux通配符:轻松实现文件搜索与匹配(linux通配符)
- 如何下载MySQL百度搜索引导您找到正确的下载链接(mysql下载 百度)
- 如何搜索Redis缓存数据(怎么查redis缓存)
- 百度新设区块链研发公司,承载百度搜索区块链业务
- 百度APP上线百度搜索购物返现 确认收货后15天到账
- JQuery+JS实现仿百度搜索结果中关键字变色效果
- .NET使用js制作百度搜索下拉提示效果(不是局部刷新)实现思路
- 仿百度的关键词匹配搜索示例
- php获取从百度搜索进入网站的关键词的详细代码
- python中使用百度音乐搜索的api下载指定歌曲的lrc歌词
- Python实现抓取百度搜索结果页的网站标题信息
- JS实现同时搜索百度和必应的方法