您现在的位置是：首页 > 数据库

当前栏目

【华为云技术分享】使用sqoop导入mysql数据到hive中

mysql 导入技术华为数据分享 hive Sqoop

2023-09-14 08:57:17 时间

Sqoop 是一个数据转储工具，它能够将 hadoop HDFS 中的数据转储到关系型数据库中，也能将关系型数据库中的数据转储到 HDFS 中。

Apache Sqoop，是"SQL to Hadoop"的意思，可以实现 Hadoop 和几乎任何外部结构化数据存储间

的双向数据传输。 Apache Sqoop 旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。

用户可以在 Sqoop 的帮助下，轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系

统 (如 HBase 和 Hive)中；同时也可以把数据从 Hadoop 系统里抽取并导出到关系型数据库

里。

2) Sqoop 通过 hadoop 的 mapreduce 把数据从关系型数据库中导入数据到 HDFS。 Sqoop

架构非常简单，其整合了 Hive、 Hbase 和 Oozie，通过 map-reduce 任务来传输数据，从而提供并发

特性和容错。

Sqoop的典型应用场景是将白天的生产的数据库中的数据在晚间导入Hive数据仓库进行分析

1、下载并安装Sqoop

tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

mv sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz sqoop-1.4.7.bin

2、设置Sqoop配置文件

cd %SQOOP_HOME%

cp conf/sqoop-env-template.sh /conf/sqoop-env.sh

在sqoop-env.sh中添加如下配置：

export HADOOP_PREFIX=/opt/hadoop-2.8.0

export HADOOP_HOME=${HADOOP_PREFIX}

export PATH=$PATH:$HADOOP_PREFIX/bin:$HADOOP_PREFIX/sbin

export HADOOP_COMMON_HOME=${HADOOP_PREFIX}

export HADOOP_HDFS_HOME=${HADOOP_PREFIX}

export HADOOP_MAPRED_HOME=${HADOOP_PREFIX}

export HADOOP_YARN_HOME=${HADOOP_PREFIX}

# Native Path

export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib/native

export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib/native"

# Hadoop end

#Hive

export HIVE_HOME=/opt/hive-2.3.3

export PATH=$HIVE_HOME/bin:$PATH

#HBase

export HBASE_HOME=/opt/hbase-2.1.0

export PATH=$HBASE/bin:$PATH

#export ZOOCFGDIR

export ZOOCFGDIR=/opt/zookeeper-3.4.13/conf/

请根据实际情况修改路径

将MySQL需要用到的jar包拷贝至$SQOOP_HOME/lib下

cp mysql-connector-java-8.0.12.jar $SQOOP_HOME/lib

3、配置环境变量

vim /etc/profile

export SQOOP_HOME=/opt/sqoop-1.4.7.bin

export PATH=$SQOOP_HOME/bin:$PATH

4、测试Sqoop

#测试MySQL连接

sqoop list-databases --connect jdbc:mysql://172.168.248.8/student --username root –P

#检验SQL语句

sqoop eval --connect jdbc:mysql://172.168.248.8/student --username root--password ******** \

--query "SELECT id,name,class,suject,score \

FROM student \

WHERE score >=90"

通过以上语句可以确认sqoop是否正常运行，连接mysql是否正常

5、从Mysql导入表数据至HDFS

sqoop import --connect jdbc:mysql://172.16.248.8/student --username root --password ******* --table student --warehouse-dir /myschool -m 1

–warehouse-dir或–target-dir 指定目录

6、从Mysql导入表数据至Hive

sqoop import --connect jdbc:mysql://172.168.248.8/studeng --username root --password ******** --table student --hive-import --hive-database default --create-hive-table -m 1

–create-hive-table：当表在Hive不存在时，使用该参数在指定数据库中添加同名表

作者：华为云MVP hellfire

猜你喜欢

Item description change will trigger ORDERADM_H update function call
Httppost上传
Docker决战到底(三) Rancher2.x的安装与使用
常见排序算法效率比较
图解 Java IO : 一、File源码
可靠性测试项目之可靠性试验
（Java实现）洛谷 P1164 小A点菜
Vue钩子函数mounted实现进入页面立即查询的功能案例
atitit. applet 浏览器插件控件的环境，开发，提示总结o9o
CEFsharp使用代理及切換
ssh-keygen配合ssh_config免密码登录VPS
SAP UI5 应用开发教程之七十八 - 如何通过 url 保持 SAP UI5 搜索的状态，让其支持书签功能试读版
SAP UI5 里如何让每次视图显示时都执行某方法
如何在TypeScript/JavaScript项目里引入MD5校验和
Atitit.编程语言新特性通过类库框架模式增强提升草案 v3 q27
和可被 K 整除的子数组——前缀和 kcnt[0] = 1是dummy表示自身容易出错
吴恩达机器学习重难点回顾
Nmap中文手册
《C程序设计的抽象思维》2.10编程练习（未完）
UnixBench----x86架构openEuler操作系统上进行性能测试

相关主题

mysql默认值
mysql数据导入
【mysql】mysql批量修改
excel导入mysql数据库
mysql远程登录

zl程序教程

当前栏目

【华为云技术分享】使用sqoop导入mysql数据到hive中

相关文章