您现在的位置是：首页 > 大数据

当前栏目

Hive使用HAProxy配置HA

配置 hive HA haproxy 使用

2023-09-14 08:56:52 时间

HAProxy是一款提供高可用性、负载均衡以及基于TCP（第四层）和HTTP（第七层）应用的代理软件，HAProxy是完全免费的、借助HAProxy可以快速并且可靠的提供基于TCP和HTTP应用的代理解决方案。

免费开源，稳定性也是非常好，这个可通过我做的一些小项目可以看出来，单Haproxy也跑得不错，稳定性可以与硬件级的F5相媲美。根据官方文档，HAProxy可以跑满10Gbps-New benchmark of HAProxy at 10 Gbps using Myricom’s 10GbE NICs （Myri-10G PCI-Express），这个数值作为软件级负载均衡器是相当惊人的。 HAProxy 支持连接拒绝 : 因为维护一个连接的打开的开销是很低的，有时我们很需要限制攻击蠕虫（attack bots），也就是说限制它们的连接打开从而限制它们的危害。这个已经为一个陷于小型DDoS攻击的网站开发了而且已经拯救了很多站点，这个优点也是其它负载均衡器没有的。 HAProxy 支持全透明代理（已具备硬件防火墙的典型特点）: 可以用客户端IP地址或者任何其他地址来连接后端服务器. 这个特性仅在Linux 2.4/2.6内核打了cttproxy补丁后才可以使用. 这个特性也使得为某特殊服务器处理部分流量同时又不修改服务器的地址成为可能。 HAProxy现多于线上的Mysql集群环境，我们常用于它作为MySQL（读）负载均衡；自带强大的监控服务器状态的页面，实际环境中我们结合Nagios进行邮件或短信报警，这个也是我非常喜欢它的原因之一； HAProxy支持虚拟主机，许多朋友说它不支持虚拟主机是错误的，通过测试我们知道，HAProxy是支持虚拟主机的。

HAProxy特别适用于那些负载特大的web站点，这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上，完全可以支持数以万计的并发连接。并且它的运行模式使得它可以很简单安全的整合进您当前的架构中，同时可以保护你的web服务器不被暴露到网络上。

在HAProxy官网下载安装包并编译

wget http://haproxy.1wt.eu/download/1.4/src/haproxy-1.4.24.tar.gz|tar zxvf

mv haproxy-1.4.24 /opt/haproxy-1.4.24

cd /opt/haproxy-1.4.24

make TARGET=linux26

添加配置文件

在/opt/haproxy-1.4.24目录下创建一个config.cfg文件，添加如下内容：

global

 daemon

 nbproc 1

 pidfile /var/run/haproxy.pid

 ulimit-n 65535

defaults

 mode tcp #mode { tcp|http|health }，tcp 表示4层，http表示7层，health仅作为健康检查使用

 retries 2 #尝试2次失败则从集群摘除

 option redispatch #如果失效则强制转换其他服务器

 option abortonclose #连接数过大自动关闭

 maxconn 1024 #最大连接数

 timeout connect 1d #连接超时时间，重要，hive查询数据能返回结果的保证

 timeout client 1d #同上

 timeout server 1d #同上

 timeout check 2000 #健康检查时间

 log 127.0.0.1 local0 err #[err warning info debug]

listen admin_stats #定义管理界面

 bind 0.0.0.0:1090 #管理界面访问IP和端口

 mode http #管理界面所使用的协议

 maxconn 10 #最大连接数

 stats refresh 30s #30秒自动刷新

 stats uri / #访问url

 stats realm Hive\ Haproxy #验证窗口提示

 stats auth admin:123456 #401验证用户名密码

listen hive #hive后端定义

 bind 0.0.0.0:10001 #ha作为proxy所绑定的IP和端口

 mode tcp #以4层方式代理，重要

 balance leastconn #调度算法 leastconn 最少连接数分配，或者 roundrobin，轮询分配

 maxconn 1024 #最大连接数

 server hive_1 192.168.1.1:10000 check inter 180000 rise 1 fall 2

 server hive_2 192.168.1.2:10000 check inter 180000 rise 1 fall 2

 #释义：server 主机代名(你自己能看懂就行)，IP:端口 每180000毫秒检查一次。也就是三分钟。

 #hive每有10000端口的请求就会创建一个log，设置短了，/tmp下面会有无数个log文件，删不完。

在HAProxy目录下执行如下命令：

haproxy -f conf.cfg

在hive-server或者hive-server2中jdbc的连接信息修改url和port，如hive-server2:

jdbc:hive2://${haproxy.hostname}:${haproxy.hive.bind.port}/${hive.database}

上面haproxy.hostname为你安装haproxy的机器名；haproxy.hive.bind.port为conf.cfg中定义的监听hive的端口（上面中定义的为10001）

Apache NiFi之MySQL数据同步到HBase 将Apache NiFi做为关系型数据与非关系型数据库的数据同步工具使用，在此场景中需要将mysql导出的avro数据格式转化为json入库HBase Ⅰ).配置ExecuteSQLRecord
当在伪分布式hadoop2.6.0集群中，部署添加了hive2.1.1后，发现输入hive命令，可以进行连接hive，但是用beeline连接连不上。
雨客微博@JavaChen，这里的所有博客文章来自http://blog.javachen.com/。

猜你喜欢

ansible实战应用系列教程10：构造条件语句和循环
C#.NET常见问题(FAQ)-delegate委托链如何使用
CWE4.8：2022年危害最大的25种软件安全问题
socket 定义 socket 类型字节序套接口地址结构服务名称数据结构 socket 通信原理 socket 编程函数图解
linux-centos下持续集成工具jenkins部署使用教程
spring boot整合mybatis步骤
常见的商业、产品、运营等概念
TCP的长连接和短连接
Queue队列
Go语言自学系列 | golang通过接口实现OCP设计原则
轮播图无限滚动
PageHelper基础知识
Windows中目录及文件路径太长无法删除的解决方法
java基础知识回顾之javaIO类---FileWriter和FileReader

相关主题

centos配置源
git配置和使用
tomcat的配置
resin配置
安装配置
android studio gradle 配置
Elasticsearch - 配置详解
MySQL 主从同步配置
Git 配置及使用
VirtualBox配置
配置别名
Logstash配置
swagger 的配置
配置IIS
Python 安装配置

zl程序教程

当前栏目

Hive使用HAProxy配置HA

相关文章