Hadoop实战-part3
AI 的算法可以公开,样本库要买
公安的人脸识别样本库,只要10MB+
电商推荐系统,推荐系数,震荡
Hadoop 2代
SNN和NN切换不会丢失数据,且不需要人为干预切换,会自动执行
自动切换由ZK完成
第一次启动集群时,所有NN为Standby,需要手动把其中一台改为 active 状态
ZK通过竞争锁使一台StandBy NN变为 Active 状态; 谁拿到ZK的写权限,就拿到这个锁
ZK部署是奇数台
(福利推荐:阿里云、腾讯云、华为云服务器最新限时优惠活动,云服务器1核2G仅88元/年、2核4G仅698元/3年,点击这里立即抢购>>>)
Journal Node
协同:不管任何机器,在监听的目录下执行任何操作,都会被监听到,并在其它ND上执行
监听NN中的edits
同步ANN和SNN中的数据
JN需要单独部署一台; 不能部署在master
NN
对外提供的只允许一台:active NN,其它的NN都是 standby 状态
部署1-5台就可以;
如何考量部署几台合适?
答:看机房归属管
自己管, 2台就可以,挂掉的NN可以马上修复
不归自己管,要保证修正前至少要有1台对外提供服务
DN与NN之间的的心跳
包含的内容
Block与DN本地文件的映射关系
自己还活着
节点的CPU、内存等资源信息信息
DN为什么要同时向ANN和SNN发送心跳?
DN与SNN、ANN发送心跳,因为除了edit fsimage 之外 还有一些东西JournalNode没有监听到
为了确保快速切换,standby状态的NameNode有必要知道集群中所有数据块的位置。
MS的架构一定要搭建HA —->如何搭建HA?百度, 老师推荐的书
ZK
ZK管理NN,NN通过心跳的方式向ZK报道
ZK部署多台,可做ZK 的HA。 做HA的前提是:有一台 NN 有处于Active的状态;
如果NN 没有Active,则没有办法竞争,投票
ZK和NN不能同时挂掉;否则,需要人为干预
不是所有的ZK都低配;要看ZK的作用和所在位置
脑裂
同时存在多个Active的NN,就会出现脑裂
如: ZK监听不到 active NN的心跳信息,就把standby NN设置为active,一会原 NN you上线了
隔离(fencing),防止脑裂,即保证在任何时候只有一个NN 处于 Active的状态。
脑裂表现出的现象、问题:
JN就会出现问题
客户端的读写也会出现问题
Hadoop 2.5 版本以后彻底解决了脑裂问题; 如果还存在脑裂,一般就是配置问题
当有多台NN时如何使用?—–> Federation
图中DN-1到DN-6是六个DataNode,NN-1到NN-4是四个NameNode,分别组成两个HA的NS,再通过Federation组合对外提供服务。Storage Pool 1和Storage Pool 2分别对应这两个NS。我们在客户端进行了挂载表的映射,把/share映射到NS1,把/user映射到NS2,这个映射其实不光是要指定NS,还需要指定到其上的某个目录。
Federation :
多个NN共用一个集群里DN上的存储资源,每个NN都可以单独对外提供服务
每个NN都会定义一个存储池,有单独的id,每个DN都为所有存储池提供存储
DN会按照存储池id向其对应的NN汇报块信息,同时,DN会向所有NN汇报本地存储可用资源情况
如果需要在客户端方便的访问若干个NN上的资源,可以使用客户端挂载表,把不同的目录映射到不同的NN,但NN上必须存在相应的目录
NameService:Hadoop 2.0里对NN进行了一层抽象,提供服务的不再是NN本身,而是NameService(以下简称NS)。Federation是由多个NS组成的,每个NS又是由一个或两个(HA)NN组成的。
Federation:
搭建这个,会同时存在多个Active 的NN
DN要向所有NN发送心跳信息;因为多个Active 的NN数据文件落地会按照副本存放策略存储,不会限定在特定的DN上; 汇报的内容与NN和DN的心跳存在稍微的不同
什么情况会用到?
单个NN扛不住的时候
机房不在同一个地方
Federation 参考资料:
http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/Federation.html?userCode=wrvvs1rm
http://www.infoq.com/cn/articles/hadoop-2-0-namenode-ha-federation-practice-zh
高低配服务器混搭(DN)
不要做这种混搭;会造成任务的执行速度更慢、需要的时间更长
低配服务器只能作为存储
高配参与计算;低配只能作为存储
如果机器已买,则把高配服务器虚拟化为低配服务器;保持配置相同
DN需要高还是低配,看需求
你还在原价购买阿里云、腾讯云、华为云、天翼云产品?那就亏大啦!现在申请成为四大品牌云厂商VIP用户,可以3折优惠价购买云服务器等云产品,并且可享四大云服务商产品终身VIP优惠价,还等什么?赶紧点击下面对应链接免费申请VIP客户吧:
相关文章
- docsify 文档站点生成器 – 建站工具
- 浏览器原理 - 事件循环
- 【Linux】Find命令使用
- vulntarget-k
- jackson反序列化器获取类型
- 中文互联网用“.中国”域名-极具影响力的国家域名!
- To C+To B双轮驱动,墨迹天气的转型启示录
- “中国四朵云”格局确立,但新的战役才刚开始
- 四种内部类你都了解了吗?
- 他们在云南乡村卖车:到村里发礼物,拿普洱抵车款
- 纳米微晶陶瓷芯:电子雾化行业的第二次“芯革命”
- 数据在内存中的存储方式--C语言版
- 加油站的智慧化转型,从AI无感加油开始
- 餐饮行业的数字化转型,不应落下中小商家
- 避风港暗流涌动,优衣库优势不再
- 乐享集团的DTC理想:数据、算法和中长尾流量
- 你需要了解的Markdown语法
- 学会Cantor表--C语言版
- 三种方法实现strlen函数
- 模拟实现不受限制的字符串函数--C语言版