hbase-1.2.1之scan、batch操作的源码学习详解编程语言
Scan操作:
1、 实例化Configuration类
Configuration conf = HbaseConfiguration.create();
同Get操作。
2、 实例化HTable类
HTable hTable = new HTable(conf,tableName);
同Get操作。
3、 实例化Scan类
Scan scan = new Scan();
4、 添加列族和列
Scan.addColumn(Bytes.toBytes(“personal”),Bytes.toBytes(“name”));
Scan.addColumn(Bytes.toBytes(“personal”),Bytes.toBytes(“city”));
5、 得到Scan的结果集
ResultScanner scanner =table.getScanner(scan);
因为扫描操作不会通过一次RPC请求返回所有匹配的行,而是以行为单位进行返回。在每调用ResultScanner.next()的时候,都会生成一个单独的RPC请求。
源码:在HTable中的756行—776行,将在HTable的构造函数中创建的连接connection传给了scan。
6、 从ResultScanner中遍历result结果。
For(Result result = scanner.next();result!= null; result = Scanner.next());
7、 Scanner.close();
**************************************************************************************************************************************************************************
批量操作:batch:
在HTable类中的883行有batch(finalList ? Extends Row actions,final Object[] results)方法。
在该batch方法中,在第885行的multiAp.submitAll中,会走到AsyncProcess中:即
submitAll
groupAndSendMultiAction(actions,1);(560行)
— RegionLocationslocs = findAllLocationsOrFail(action,true);(868行)
— loc =connection.locateRegion(tableName…);(951行)。
即对actions列表中的每一个action,都会利用connection去定位对应的region的location。但是此处用到的connection为实例化HTable时创建的连接。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/13739.html
c相关文章
- hbase 2.+版本集成zeppelin 0.8.2/0.9.1
- 大数据spark、hadoop、hive、hbase面试题及解析[通俗易懂]
- Hbase面试题(持续更新)「建议收藏」
- 基于Django+LayUI+HBase的文献数据挖掘系统(附源码)
- HBase单机实现主主复制(高可用方案)
- Flink开发-Hive数据导入HBase中
- HBase 快速入门(安装和命令操作)
- Hbase(补充)详解大数据
- HBase学习之路 (七)HBase 原理详解大数据
- HBase集群中RegionServer崩溃后的快速恢复措施探索详解大数据
- HBase-1.2.1之Get操作源码学习详解大数据
- HBase特征详解大数据
- hbase和zookeeper的安装和部署详解大数据
- 深入浅出:从HBase导入至MySQL(hbase导入mysql)
- MySQL数据导入HBase:构建NoSQL数据库(mysql导入hbase)