您现在的位置是：首页 > 数据库

当前栏目

Spark SQL入门示例

SQL Spark 入门示例

2023-09-14 09:01:57 时间

Spark SQL入门示例

首先，导入pom依赖：

<properties>
    <maven.compiler.source>8</maven.compiler.source>
    <maven.compiler.target>8</maven.compiler.target>
    <spark.version>3.1.1</spark.version>
    <spark.scala.version>2.12</spark.scala.version>
</properties>
<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-sql_${spark.scala.version}</artifactId>
    <version>${spark.version}</version>
</dependency>

只需要导入这一个坐标即可：spark-sql_${spark.scala.version}

接着编写代码：

package com.zxl.spark.sql

import org.apache.spark.sql.catalog.{Database, Table}
import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.{DataFrame, Dataset, SparkSession, catalog}

object lesson01_sql_basic {
  def main(args: Array[String]): Unit = {
    //  sql字符串 ==》 dataset 是对rdd的包装
    //  只有rdd才能触发DAGScheduler
    val conf: SparkConf = new SparkConf().setMaster("local").setAppName("testsql")
    val session: SparkSession = SparkSession.builder()
      .config(conf)
      //.enableHiveSupport()  spark sql on hive需要开启  支持ddl
      .getOrCreate()
    //可以获取到sc
    val sparkContext: SparkContext = session.sparkContext
    sparkContext.setLogLevel("ERROR")
    val dataFrame: DataFrame = session.read.json("input/json")
    //展示数据
    println(">" * 50)
    dataFrame.show()
    //展示schema
    println(">" * 50)
    dataFrame.printSchema()
    //while (true){}
    println(">" * 50)
    val databases: Dataset[Database] = session.catalog.listDatabases()
    databases.show()
    println(">" * 50)
    val tables: Dataset[Table] = session.catalog.listTables()
    tables.show()
    println(">" * 50)
    val functions: Dataset[catalog.Function] = session.catalog.listFunctions()
    functions.show()
    println(">" * 50)
    dataFrame.createTempView("abc")
    val dataFrame1: DataFrame = session.sql("select * from abc")
    dataFrame1.show()
    println(">" * 50)
    session.catalog.listTables().show()

    import scala.io.StdIn.readLine
    while (true){
      val sqlStr: String = readLine("input your sql:")
      session.sql(sqlStr).show()
    }

  }

}

执行结果演示》》

猜你喜欢

Vue学习之--------Vue中过滤器(filters)的使用（代码实现）（2022/7/18）
[ChatGPT 勘误]SAP ABAP 里 CL_WB_ED_ENHANCEMENT_HANDLER 的用途介绍
PHP中把stdClass Object转array的几个方法
Livy安装使用（Spark rest接口服务工具）
智能优化算法：蝴蝶优化算法-附代码
【codeforces 761C】Dasha and Password(贪心+枚举做法)
Android 详解build.gradle文件
SpringMvc的基本流程
memcache、redis原理对比
Mongodb聚合时间分组(转载)
Java实现 LeetCode 207 课程表
优先级队列priority_queue自定义比较函数
基于离线SDK开发第一个简单示例算法
停止Java线程，小心interrupt()方法
图神经网络的攻击防御
java核心知识点学习----创建线程的第三种方式Callable和Future CompletionService
问题解决：安装 protobuf 的过程及出现的 bug 记录
对于PowerDesigner中设计表自动生成Sql的分析

相关主题

SQL 总结
spark-sql
SQL递归
Sql优化-limit

zl程序教程

当前栏目

Spark SQL入门示例

Spark SQL入门示例

相关文章