您现在的位置是：首页 > 数据库

当前栏目

Hbase(补充)详解大数据

HBase 数据详解补充

2023-06-13 09:20:22 时间

1、用sqoop 从mysql数据库导入数据到hbase时:

可以用 sqoop list-databases connect jdbc:mysql://192.168.1.152:3306/ username sqoop password sqoop 测试是否可以连接到mysql数据库

2、hbase 命令时，无法删除打错的命令，解决办法：option——session options——Terminal——Enulation——选择Linux。可以按住Ctrl +回车键删除

3、CRT 修改字体大小：option——session options——Terminal——Appearance——Front （修改背景颜色是current color scheme）

4、sqoop导入数据从mysql到hbase时，mysql中的数据类型可以使基本数据类型，不能是二进制类型的，导入hbase后，都以字节数组存储

5、创建一个列簇压缩格式为snappy的表： create CarData , { NAME = car , COMPRESSION = SNAPPY }

6、如果修改表压缩格式为snappy：

 disable  test 

 alter  test , NAME =   f , COMPRESSION =   snappy

NAME即column family，列族。HBase修改压缩格式，需要一个列族一个列族的修改。而且这个地方要小心，别将列族名字写错，或者大小写错误。因为这个地方任何错误，都会创建一个新的列族，且压缩格式为snappy。当然，假如你还是不小心创建了一个新列族的话，可以通过以下方式删除：

 alter  test , {NAME= f , METHOD= delete }

 enable  test 

 major_compact  test

describe 该表，验证是否生效

7、hbase 过滤时：

scan.setTimeRange() 方法是左闭右开，根据数据的入库时间过滤

8、spark 从hbase 根据列值过滤器过滤出数据形成RDD：

 val conf = new SparkConf().setAppName( daycount ) 

// .setMaster( local ) 

 val sc = new SparkContext(conf) 

 val hbaseConf = HBaseConfiguration.create() 

 val tablename =     

 val sca=new Scan() 

 val filter1=new SingleColumnValueFilter(Bytes.toBytes( gps ), 

 Bytes.toBytes( GPSTime ), 

 CompareOp.LESS, 

 new BinaryComparator(Bytes.toBytes(getTodayZero_time))) 

 filter1.setFilterIfMissing(true) 

 val filter2=new SingleColumnValueFilter(Bytes.toBytes( gps ), 

 Bytes.toBytes( GPSTime ), 

 CompareOp.GREATER_OR_EQUAL, 

 new BinaryComparator(Bytes.toBytes(getYesTZero_time))) 

 filter2.setFilterIfMissing(true) 

 val filterArr=new util.ArrayList[Filter]() 

 filterArr.add(filter1) 

 filterArr.add(filter2) 

 val filterlist=new FilterList(FilterList.Operator.MUST_PASS_ALL,filterArr) 

 sca.setFilter(filterlist) 

 hbaseConf.set( hbase.zookeeper.quorum ,    ) 

 hbaseConf.set( hbase.zookeeper.property.clientPort ,  2181 ) 

// hbaseConf.set( hbase.zookeep.znode.parent ,  /hbase ) 

// hbaseConf.set( hbase.master ,    ) 

 hbaseConf.set(TableInputFormat.INPUT_TABLE, tablename) 

 hbaseConf.set(TableInputFormat.SCAN,convertScanToString(sca)) 

 val hBaseRDD = sc.newAPIHadoopRDD(hbaseConf, classOf[TableInputFormat], 

 classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable], 

 classOf[org.apache.hadoop.hbase.client.Result])

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/7734.html

分布式文件系统，分布式数据库区块链并行处理（MPP）数据库，数据挖掘开源大数据平台数据中台数据分析数据开发数据治理数据湖数据采集

猜你喜欢

GitHub访问越来越慢了，怎么办？
NoSql数据库之db4o详解数据库
滴滴开源3周年，都发布过哪些项目？
Java之final修饰符详解编程语言
Oracle数据库中的几种链接关系（oracle几种链接关系）
2019最新三年php 面试题[通俗易懂]
谷歌拼音在Linux上的应用与配置（谷歌拼音linux）
arrify转数组
Linux PFX证书：实现安全与便利性（linuxpfx证书）
javascripttrim去空格函数实现代码
云端golang开发，无需本地配置，能上网就能开发和运行
Oracle操作：删除分区索引的步骤（oracle删除分区索引）
巨鲸音乐播放器 v3.0.1
Linux：探索分支的秘密（linux的分支）
Oracle中的关联随机赋值研究（oracle关联随机赋值）

zl程序教程

当前栏目

Hbase(补充)详解大数据

相关文章