大数据开发岗面试复习30天冲刺 - 日积月累,每日五题【Day10】——Hbase4
2023-04-18 13:08:34 时间
前言
本栏目大数据开发岗高频面试题主要出自
大数据技术
专栏的各个小专栏,由于个别笔记上传太早,排版杂乱,后面会进行原文美化、增加。
文章目录
停不要往下滑了,
默默想5min,
看看这5道面试题你都会吗?
面试题 01、列族设计规则是什么?
面试题02、Hive on Hbase的实现原理是什么?
面试题 03、Phoenix是什么?
面试题04、什么是二级索引?为什么要构建二级索引
面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?
以下答案仅供参考:
面试题 01、列族设计规则是什么?
•个数原则:如果列的个数比较多,建议2 ~ 3个,如果列的个数比较少,建议1个 –列族个数多了,导致比较次数变多,降低性能 –列族个数少了,导致列的比较次数变多,降低性能 •长度原则 :能满足业务需求的情况下,越短越好
面试题02、Hive on Hbase的实现原理是什么?
•Hive on Hbase的原理是通过MapReduce实现对Hbase数据的读写 •MapReduce中提供了TableInputFormat读取Hbase数据,TableOutputFormat写入数据到Hbase
面试题 03、Phoenix是什么?
•Phoenix是一个专门为Hbase设计的SQL on Hbase的工具 •底层通过Hbase API和大量的协处理器实现 •可以实现基于SQL访问Hbase以及构建维护二级索引等功能
面试题04、什么是二级索引?为什么要构建二级索引
•二级索引指的是基于一级索引之上再构建一层索引 •Hbase使用Rowkey作为唯一索引,只有使用Rowkey前缀进行查询,才走索引查询 •导致大部分的查询都是不走索引,性能比较差 •通过建立二级索引,可以通过走两次索引代替全表扫描,加快查询速度
面试题05、Phoenix实现二级索引时,可以构建哪些索引类型?
•全局索引 •覆盖索引 •本地索引 •函数索引
总结
今天我们复习了面试中常考的Hbase相关的五个问题,你做到心中有数了么?
相关文章
- 直接在代码里面对list集合进行分页
- .NET Framework 4.5新特性详解
- 大数据的简要介绍
- 大数据的由来
- 高斯混合模型的自然梯度变量推理
- timing-wheel 仿Kafka实现的时间轮算法
- 使用Navicat软件连接自建数据库(Linux系统)
- 那一天,我被Redis主从架构支配的恐惧
- Redis 深入了解键的过期时间
- C#使用委托调用实现用户端等待闪屏
- 基于流计算 Oceanus 和 Elasticsearch Service 构建百亿级实时监控系统
- GRAND | 转录调控网络预测数据库
- JFreeChart API中文文档
- 临床相关突变查询数据库
- TIGER | 人类胰岛基因变化查询数据库
- 视频边缘计算网关EasyNVR在视频整体监控解决方案中的应用分析
- Apache Arrow - 大数据在数据湖后的下一个风向标
- 常见的电商数据指标体系
- AKShare-艺人数据-艺人流量价值
- MySQL中多表联合查询与子查询的这些区别,你可能不知道!