您现在的位置是：首页 > 数据库

当前栏目

xeus-sql：让Jupyter支持SQL处理

数据库数据库 SQL

2023-03-14 22:26:33 时间

现在用Jupyter进行数据处理，对数据工作者来说已经不是一个新鲜事情了。然而如何将大量数据导入却是一个比较棘手的事情。大家都知道关系数据库是数据存储的最重要的载体，那么对数据库的支持是Jupyter数据科学界一个迫切的需求。

此前Jupyter曾发布过一个内核xeus-sqlite允许用户直接从notebook进行SQLite查询。日前Jupyter新发布了一个新的项目xeus-sql，这是对xeus-sqlite的扩展，是Jupyter的通用数据库访问工具，使用它可以在绝大多数的关系数据库上进行SQL查询。

数据库支持

xeus-sql支持市面上的绝大多数数据，包括：

MySQL
PostgreSQL的
SQLite3
DB2
Oracle
Firebird

以及支持ODBC驱动程序的任何数据库。

为了提供所有这些集成，xeus-sql依赖SOCI库作为项目的主干。SOCI在统一的C++ API之后抽象所有不同的数据库连接和查询详细信息。xeus-sql使用SOCI和xeus将SQL功能公开给Jupyter。

安装

为确保安装正常进行，最好xeus在一个全新的conda环境中安装。xeus-sql还需要使用miniconda安装，完整的anaconda 可能会产生冲突。最安全的用法是创建一个以xeus-sqlminiconda安装命名的环境：

conda create -n xeus-sql 
conda activate xeus-sql

从conda安装

Conda forge提供了MySQL，PostgreSQL和SQLite的打包版本，可以使用conda或mamba轻松安装它们一键安装，使用conda软件包管理器安装xeus-sql：

conda install xeus-sql jupyterlab -c conda-forge

或者使用mamba：

mamba install xeus-sql jupyterlab -c conda-forge

或者可以分别安装：

mamba install xeus-sql soci-mysql -c conda-forge 
mamba install xeus-sql soci-postgresql -c conda-forge 
mamba install xeus-sql soci-mysql -c conda-forge

不同的SQL后端之间存在一些差异，可以参考xeus-sql详细文档和示例学习。

使用方法

要连接MySQ，需要首先安装xeus-sql和soci-mysql，然后用LOAD加载连接数据库：

%LOAD mysql db=dbname user=user1 password='Password123#@!'

上面db数据库名称，user为连库用户名，password为用户密码。

连接成功就可以执行数据库命令和SQL语句，比如：

show databases; 
SELECT * FROM test 
INSERT INTO example VALUES (2, 'Core') 
SELECT * FROM example 
INSERT INTO example VALUES (3, 'Table')

其他数据库后端也类似：

firebird：

%LOAD firebird service=firebird.fdb user=SYSDBA

postgresql：

%LOAD postgresql dbname=newdvdrental

可视化查询

对于熟悉可视化SQL表和查询结果的表形式的用户，Jupyter的丰富显示系统提供了根据使用的应用程序将它们显示为丰富文本显示还是纯文本显示的选项。

除了显示带有表的查询之外，在还可以直接在Notebook中根据查询结果轻松创建Vega-Lite图形：

Vega-Lite是一个功能强大的库可以使用xeus-sql从关系数据中创建许多不同的可视化文件。

为了支持此功能，xeus-sql依赖于xvega(vega的C++后端)和定制的Jupyter魔术来绘制通过xvega-bindings实用程序库中实现的微型语言。除了使用迷你语言之外，还可以直接提供可视化的JSON规范。

总结

xeus-sql的推出，让Jupyter如虎添翼，可以非常方便数据工作者进行数据处理和可视化。同时对于传统dba和数据库用户可以使用Jupyter作为一个便捷的数据库客户端。

猜你喜欢

Java基础--类
不下载python的情况下如何运行python程序
2020 年 8 月份 AWS 在线技术讲座
java基础总结
python绘制多边形_在python matplotlib中绘制三维多边形
Java基础总结
Amazon ECS 现在支持 EC2 Inf1 实例
java基础总结
Amazon Braket – 开始使用量子计算
Linux CentOS 7 python2.X升级python3.X
Java--基础总结
AWS Step Functions 添加了对“选择”状态的更新、对上下文对象的全局访问、动态超时、结果选择并为 Amazon States Languages 添加了内部函数
Python文件类型(python如何在机器上被运行)
用于 Kubeflow Pipelines 的 Amazon SageMaker Components 介绍
【Python从零到壹】Python模块介绍与使用
java概述-001
Spark集群，多个版本Python/Python Package管理
基于 AWS Graviton2 Arm 架构处理器的 Amazon EC2 C6g 实例为转码工作负载带来更高的性价比
【Python】pip模块管理Python包的常用方法
java面试题

zl程序教程

当前栏目

xeus-sql：让Jupyter支持SQL处理

相关文章