(数据科学学习手札93)利用geopandas与PostGIS进行交互
本文完整代码及数据已上传至我的
Github
仓库https://github.com/CNFeffery/DataScienceStudyNotes
1 简介
PostGIS
作为postgresql
针对地理空间数据的拓展功能,可以帮助我们有效管理和固化空间矢量数据,以及开展空间数据分析,而geopandas
作为Python
生态中优秀的空间数据分析处理工具,自然在与PostGIS
进行交互方面开发了相应的功能。
本文就将针对如何利用geopandas
向PostGIS
空间数据库写入及读取矢量数据进行介绍。
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192531841-433284485.png)
2 geopandas与PostGIS进行交互
为了能在geopandas
中与postgresql
和PostGIS
建立连接,请确保以下3个库已经安装:
pip install sqlalchemy psycopg2-binary geoalchemy2
接下来我们需要保证postgresql
中存在可以连接的空间数据库,在pgAdmin界面内新建数据库,譬如这里我们新建数据库demo
:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192540010-2018455388.png)
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192542688-668228208.png)
点击保存成功创建数据库之后,要注意这时我们的demo
数据库只是个普通的postgresql
数据库,是不支持空间相关功能的,在对应数据库上右键打开查询工具:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192545509-1741808682.png)
在弹出的界面中输入CREATE EXTENSION postgis;
并执行,成功之后我们的数据库就变成了空间数据库,支持空间相关的各种功能:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192548429-1317323107.png)
至此我们的准备工作就已结束,接下来我们就可以直接在geopandas
中读写PostGIS
数据表。
2.1 利用geopandas向PostGIS写入数据
为方便演示,这里我们以简化版的重庆市区县矢量面数据为例,首先我们导入所需的geopandas
(注意geopandas
版本必须大于等于0.8.0)与sqlalchemy
(后者用于创建数据库连接),并读入重庆市.geojson
文件,你可以在开头的Github
仓库找到它:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192551175-498866869.png)
接着我们来演示如何通过geopandas
向PostGIS
推送矢量信息表,使用到的API为to_postgis()
,其主要参数如下:
name:字符型,用于指定推送到
PostGIS
后的表名称con:
sqlalchemy.engine.Engine
对象,用于建立与数据库的连接if_exists:字符型,用于指定当数据库中已存在同名表时的相应策略,
'fail'
表示抛出错误,'replace'
指替换,'append'
指向原表追加,默认为fail
schema:字符型,用于指定
schema
,默认为'public'
index:bool型,用于指定是否保留index信息
index_label:字符型或序列,当index被设置为True时为index信息指定字段名称
首先需要利用sqlalchemy
中的create_engine
来创建数据库连接,传入字符串包含了数据库类型、用户名、密码、主机IP、端口以及数据库名称,格式为:
数据库类型://用户名:密码@主机IP:端口/数据库名称
对应本例:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192553912-1743440816.png)
在pgAdmin
中随即就能查看到刚才写入的数据表:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192556616-70139112.png)
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192559852-1581767160.png)
2.2 利用geopandas从PostGIS读取数据
从PostGIS
中读取数据要用到另一个API,对应geopandas
的read_postgis()
,其主要参数如下:
sql:字符型,对应从空间数据库中提取数据的SQL语句
con:同
to_postgis()
geom_col:字符型,用于指定将哪一列作为
GeoDataFrame
的矢量列crs:用于指定坐标参考系,同
GeoDataFrame
的坐标参考系设定方式index_col:字符型或列表,用于指定将哪些列作为索引
parse_dates:列表,用于预解析时间类型数据
接着我们从PostGIS
中读取刚才写入的表:
![](https://img2020.cnblogs.com/blog/1344061/202008/1344061-20200811192603286-496219282.png)
简简单单,我们就实现了与PostGIS
的交互。
以上就是本文的全部内容,如有疑问欢迎在评论区与我讨论~
相关文章
- es6学习
- Android开发学习---如何写数据到外部存储设备(sd卡),Environment.getExternalStorageDirectory,怎么获取sd卡的大小?
- AngularJS学习--- AngularJS中数据双向绑定(two-way data-binding) orderBy step4
- 【第三篇】学习 android 事件总线androidEventbus之list数据事件的传递,发送list数据事件到另外一个Activity
- 《从零开始学Swift》学习笔记(Day 46)——下标重写
- 《从零开始学Swift》学习笔记(Day 6)——哎呀常量和变量都该什么时候用啊?
- 机器学习笔记 - 什么是标准正态分布表?
- 机器学习笔记 - HaGRID—手势识别图像数据集简介
- 机器学习笔记 - 什么是稀疏矩阵?
- ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
- ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)+预测新数据得分
- ML之回归预测:利用13种机器学习算法对Boston(波士顿房价)数据集【13+1,506】进行回归预测(房价预测)来比较各模型性能
- ML之回归预测:利用十类机器学习算法(线性回归、kNN、SVM、决策树、随机森林、极端随机树、SGD、提升树、LightGBM、XGBoost)对波士顿数据集回归预测(模型评估、推理并导到csv)
- DL之VGG16:基于VGG16(Keras)利用Knifey-Spoony数据集对网络架构进行迁移学习
- TF之CNN:利用sklearn(自带手写数字图片识别数据集)使用dropout解决学习中overfitting的问题+Tensorboard显示变化曲线
- 已解决(机器学习分割数据问题) ModuleNotFoundError: No module named ‘sklearn.cross_validation‘
- 美赛数据网站和学习资料
- Zookeeper 的学习与运用
- thinkphp学习资料
- CC2540开发板学习笔记(七)—— 睡眠唤醒
- 动手学习数据分析(四)——数据可视化
- HLS开发学习-14- Vivado HLS 函数层面的优化
- 转行入职数据科学(数据分析挖掘,机器学习方向)需要的硬技能。
- 【机器学习实战】10、利用PCA来简化数据
- 【机器学习实战】9、利用K-means算法对未标注数据分组
- TensorFlow:实战Google深度学习框架(一)计算、数据、运行模型
- ML之RL:基于MovieLens电影评分数据集利用强化学习算法(多臂老虎机+EpsilonGreedy策略)实现对用户进行Top电影推荐案例
- 深度学习笔记:利用数据增强在小数据集上从头训练卷积神经网络
- 什么是数据清洗和特征工程?机器学习知识点讲解