爬虫与MySQL的结合之旅(爬虫mysql)
爬虫与MySQL结合之旅
随着互联网的发展,网站的信息也越来越多,为了获取大量的数据,爬虫技术就应运而生。 爬虫技术可以自动抓取网页中的所需数据,节约我们大量的时间,而且实现代码自动化。
然而,获取到数据后,想要进行后续处理,我们还需要有一个存储把这些刚抓取的数据进行存储,以便日后使用。常用的存储方式有文件存储和数据库存储,而数据库MySQL更具有存储量大、数据库操作方便等优势。
因此,我们需要把爬取到的数据,存储到数据库MySQL中,爬取与MySQL的结合之旅就此开启。
我们首先要做的就是使用Python连接到MySQL数据库, 可以使用MySQL官方提供的MySQL Connector for Python库,非常容易就可以用Python连接到MySQL数据库,先用下面的代码进行测试:
import mysql.connector
# 连接MySQL数据库
mydb = mysql.connector.connect(
host = localhost , # 数据库主机地址
user = yourusername , # 数据库用户名
passwd = yourpassword # 数据库密码
)
# 打印数据库连接是否成功
print(mydb)
# 成功显示:
# 现在成功连接到MySQL数据库,接下来就是准备执行数据库操作,Query查询一下已存在数据表:
# 创建游标对象
mycursor = mydb.cursor()
# 使用 execute()方法执行 SQL 查询
mycursor.execute( SHOW TABLES )
for x in mycursor:
print(x)
# 执行结果为:
# ( your_table_name , )
# 可以看到,现在我们已经可以用Python查询到已存在数据表了,现在就是创建新的数据表,然后插入获取到的爬虫数据:
# 创建数据表
sql = CREATE TABLE crawldata (id INT AUTO_INCREMENT PRIMARY KEY,content VARCHAR(255))
# 执行SQL语句
mycursor.execute(sql)
# 然后插入爬虫数据
sql = INSERT INTO crawldata (content) VALUES (%s)
val = ( This is a crawler data )
# 执行SQL语句
mycursor.execute(sql, val)
# 提交数据
mydb.commit()
# 打印插入之后的数据:
mycursor.execute( SELECT * FROM crawldata )
myresult = mycursor.fetchall()
for x in myresult:
print(x)
# 执行结果为:
# (1, This is a crawler data )
从上面的代码可以看到,当爬虫技术与MySQL结合时,我们可以在MySQL数据库中创建数据表,存储爬虫抓取到的数据,并且可以方便的查询,获取爬虫数据,这样我们就可以较为轻松的进行数据后期处理了。
总而言之,爬虫与MySQL的结合之旅,是爬虫开发中绕不开的一段路,结合之后,才可以发挥出爬虫的价值,大大提高我们的效率,非常值得推荐。
我想要获取技术服务或软件
服务范围:MySQL、ORACLE、SQLSERVER、MongoDB、PostgreSQL 、程序问题
服务方式:远程服务、电话支持、现场服务,沟通指定方式服务
技术标签:数据恢复、安装配置、数据迁移、集群容灾、异常处理、其它问题
本站部分文章参考或来源于网络,如有侵权请联系站长。
数据库远程运维 爬虫与MySQL的结合之旅(爬虫mysql)
相关文章
- 数据表修复:MySQL的魅力之旅(mysql修复数据表)
- MySQL 使用 ALTER 语句增加表列(mysql增加列语句)
- Mysql之旅:探索SQL方言的乐趣(mysql方言)
- MySQL数据目录:开启完美存储之旅(mysql的data目录)
- MySQL如何合并两个表(mysql把两个表合并)
- Mysql 表开放——激活数据库功能(mysql打开表)
- 可视化管理MySQL 开启可视化管理之旅——从哪挑选合适的工具(mysql用什么工具)
- 数据库MySQL:开启新数据库之旅(mysql.创建)
- 『MySQL 分组查找最大值』(mysql分组最大值)
- 从MySQL初级到高级运维的完美之旅(mysql初级到高级运维)
- MySQL实现数据库管理的魅力(mysql怎么样)
- MySQL日期字符串的转换技巧(mysql日期字符串转换)
- MySQL学习之旅:构建自己的计划(mysql学习计划)
- MySQL 遍历技巧:精选数据库之旅(mysql 遍历数据库)
- 指尖轻敲:打开MySQL 数据库之旅(打开mysql数据库文件)
- MySQL存储过程实现分表处理(mysql存储过程分表)
- 轻松学习MySQL中的sum函数详细教程(mysql中sum教程)
- 数据库中的MySQL 理解Mysql数据库的重要性(MySql中mysql)
- MySQL 中 Cast 函数的使用方法(mysql中cast用法)
- 老杜在B站开启MySQL学习之旅(b站老杜mysql笔记)
- MySQL on macOS的安装之旅唤醒brew的力量(brew安装的mysql)