zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

mongodb高可用集群部署

2023-09-11 14:22:19 时间

mongodb是最常用的nosql数据库,在数据库排名中已经上升到了前六。这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群。
在搭建集群之前,需要首先了解几个概念:路由,分片、副本集、配置服务器等。

相关概念

 

 


从图中可以看到有四个组件:mongos、config server、shard、replica set。

1.mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。
2.config server,顾名思义为配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!
3.shard,分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。将数据分散到不同的机器上,不需要功能强大的服务器就可以存储更多的数据和处理更大的负载。基本思想就是将集合切成小块,这些块分散到若干片里,每个片只负责总数据的一部分,最后通过一个均衡器来对各个分片进行均衡(数据迁移)。
4.replica set,中文翻译副本集,其实就是shard的备份,防止shard挂掉之后数据丢失。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性, 并可以保证数据的安全性。
5.仲裁者(Arbiter),是复制集中的一个MongoDB实例,它并不保存数据。仲裁节点使用最小的资源并且不要求硬件设备,不能将Arbiter部署在同一个数据集节点中,可以部署在其他应用服务器或者监视服务器中,也可部署在单独的虚拟机中。为了确保复制集中有奇数的投票成员(包括primary),需要添加仲裁节点做为投票,否则primary不能运行时不会自动切换primary。
简单了解之后,我们可以这样总结一下,应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失同步在副本集中存储了一份,仲裁在数据存储到分片的时候决定存储到哪个节点。

环境准备

系统系统 Ubuntu 18.04.1 LTS 三台服务器:10.20.71.135/10.20.73.182/10.20.70.61 安装包:mongodb-org-server_4.0.6_amd64.deb

服务器规划
服务器mongo-135 服务器mongo-182 服务器mongo-61
mongos mongos mongos
config server config server config server
shard server1 主节点 shard server1 副节点 shard server1 仲裁
shard server2 仲裁 shard server2 主节点 shard server2 主节点
shard server3 副节点 shard server3 仲裁 shard server3 主节点
端口分配:

mongos:20000
config:21000
shard1:27017
shard2:27017
shard3:27017
集群搭建

1. mongodb源配置

sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 9DA31620334BD75D9DCB49F368818C72E52529D4
echo "deb [ arch=amd64 ] https://repo.mongodb.org/apt/ubuntu bionic/mongodb-org/4.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-4.0.list
sudo apt-get update
会安装对应源的mongo所有依赖包,此处不执行
# sudo apt-get install -y mongodb-org
echo "mongodb-org hold" | sudo dpkg --set-selections
echo "mongodb-org-server hold" | sudo dpkg --set-selections
echo "mongodb-org-shell hold" | sudo dpkg --set-selections
echo "mongodb-org-mongos hold" | sudo dpkg --set-selections
echo "mongodb-org-tools hold" | sudo dpkg --set-selections

# 安装依赖
apt install -y mongodb-org-mongos mongodb-org-shell mongodb-org-tools
参考

2. mongodb安装

wget https://repo.mongodb.org/apt/ubuntu/dists/bionic/mongodb-org/4.0/multiverse/binary-amd64/mongodb-org-server_4.0.6_amd64.deb
dpkg -i mongodb-org-server_4.0.6_amd64.deb
分别在每台机器建立conf、mongos、config、shard1、shard2、shard3六个目录,因为mongos不存储数据,只需要建立日志文件目录即可。

mkdir -p /usr/local/mongodb/conf
mkdir -p /usr/local/mongodb/mongos/log
mkdir -p /usr/local/mongodb/configsvr/{data,log}
mkdir -p /usr/local/mongodb/shard1/{date,log}
mkdir -p /usr/local/mongodb/shard2/{data,log}
mkdir -p /usr/local/mongodb/shard3/{data,log}
准备集群间通信使用的加密key

创建mongod、mongos之间通信所使用的key文件,在任意一台服务器上执行:

openssl rand -base64 756 > /etc/mongodb/conf/key
chmod 400 /data/mongodb/conf/key
# 将/data/mongodb/conf/key文件拷贝到其它服务器上,保持文件权限不变
connfig server配置服务器

mongodb3.4以后要求配置服务器也创建副本集,不然集群搭建不成功。添加配置文件

root@mgo-db01cn-p001:/data/mongodb/conf# cat configsrv.conf
storage:
dbPath: /data/mongodb/config/data
journal:
enabled: true

systemLog:
destination: file
logAppend: true
path: /data/mongodb/config/log/configsrv.log

net:
port: 21000
bindIp: 0.0.0.0

processManagement:
timeZoneInfo: /usr/share/zoneinfo

security:
keyFile: /data/mongodb/conf/key
authorization: enabled

replication:
replSetName: configs

sharding:
clusterRole: "configsvr"
分别启动三台服务器的config server 方式一:

mongod -f /data/mongodb/conf/configsrv.conf
方式二:

root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongosrv.service
[Unit]
Description=MongoDB Database Config Server
After=network.target
Documentation=https://docs.mongodb.org/manual

[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/configsrv.conf
PIDFile=/data/mongodb/config/log/configsrv.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false

# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings

[Install]
WantedBy=multi-user.target
systemctl daemon-reload
systemctl start mongosrv.service
systemctl enable mongosrv.service
登录任意一台配置服务器,初始化配置副本集

#连接
mongo --port 21000
#config变量
config = {
_id : "configs",
members : [
{_id : 0, host : "10.20.71.135:21000" },
{_id : 1, host : "10.20.73.182:21000" },
{_id : 2, host : "10.20.70.61:21000" }
]
}
#初始化副本集
rs.initiate(config)
其中,”_id” : “configs”应与配置文件中配置的 replicaction.replSetName 一致,”members” 中的 “host” 为三个节点的 ip 和 port

配置分片副本集(三台机器)

设置第一个分片副本集(shard1)
1. 配置文件

root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard1.conf
storage:
dbPath: /data/mongodb/shard1/data
journal:
enabled: true

systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard1/log/shard1.log

net:
port: 27017
bindIp: 0.0.0.0


processManagement:
timeZoneInfo: /usr/share/zoneinfo

security:
keyFile: /data/mongodb/conf/key
authorization: enabled


replication:
replSetName: shard1

sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件

root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard1.service
[Unit]
Description=MongoDB Shard1 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual

[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard1.conf
PIDFile=/data/mongodb/shard1/log/shard1.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false

# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings

[Install]
WantedBy=multi-user.target
启动方式一:

root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard1.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard1.service
启动方式二:

mongod -f /data/mongodb/conf/shard1.conf
登陆任意一台服务器,初始化副本集:

在任意一台服务上初始化复制集配置:

mongo --port 27017
#使用admin数据库
use admin
#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard1",
members : [
{_id : 0, host : "10.20.71.135:27017" },
{_id : 1, host : "10.20.73.182:27017" },
{_id : 2, host : "10.20.70.61:27017", arbiterOnly: true }
]
}
#初始化副本集配置
rs.initiate(config);
rs.status()
rs.conf()
设置第二个分片副本集(shard2)
1. 配置文件

root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard2.conf
storage:
dbPath: /data/mongodb/shard2/data
journal:
enabled: true

systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard2/log/shard2.log

net:
port: 27018
bindIp: 0.0.0.0


processManagement:
timeZoneInfo: /usr/share/zoneinfo

security:
keyFile: /data/mongodb/conf/key
authorization: enabled


replication:
replSetName: shard2

sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件

root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard2.service
[Unit]
Description=MongoDB Shard2 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual

[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard2.conf
PIDFile=/data/mongodb/shard2/log/shard2.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false

# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings

[Install]
WantedBy=multi-user.target
启动方式一:

root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard2.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard2.service
启动方式二:

mongod -f /data/mongodb/conf/shard2.conf
登陆任意一台服务器,初始化副本集:

在任意一台服务上初始化复制集配置:

mongo --port 27018
#使用admin数据库
use admin
#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard2",
members : [
{_id : 0, host : "10.20.71.135:27018" },
{_id : 1, host : "10.20.73.182:27018", arbiterOnly: true },
{_id : 2, host : "10.20.70.61:27018" }
]
}
#初始化副本集配置
rs.initiate(config);
设置第二个分片副本集(shard3)
1. 配置文件

root@mgo-db01cn-p001:/data/mongodb/conf# egrep -v ^# shard3.conf
storage:
dbPath: /data/mongodb/shard3/data
journal:
enabled: true

systemLog:
destination: file
logAppend: true
path: /data/mongodb/shard3/log/shard3.log

net:
port: 27019
bindIp: 0.0.0.0


processManagement:
timeZoneInfo: /usr/share/zoneinfo

security:
keyFile: /data/mongodb/conf/key
authorization: enabled


replication:
replSetName: shard3

sharding:
clusterRole: "shardsvr"
2. 制作服务启动文件

root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongod-shard3.service
[Unit]
Description=MongoDB Shard3 Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual

[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongod --config /data/mongodb/conf/shard3.conf
PIDFile=/data/mongodb/shard3/log/shard3.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false

# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings

[Install]
WantedBy=multi-user.target
启动方式一:

root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongod-shard3.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongod-shard3.service
启动方式二:

mongod -f /data/mongodb/conf/shard3.conf
登陆任意一台服务器,初始化副本集:

mongo --port 27019

use admin

#定义副本集配置,第三个节点的 "arbiterOnly":true 代表其为仲裁节点。
config = {
_id : "shard3",
members : [
{_id : 0, host : "10.20.71.135:27019",arbiterOnly: true },
{_id : 1, host : "10.20.73.182:27019" },
{_id : 2, host : "10.20.70.61:27019" }
]
}

#初始化副本集配置
rs.initiate(config);
配置路由服务器 mongos

先启动配置服务器和分片服务器,后启动路由实例:(三台机器) 1. 配置文件

systemLog:
destination: file
logAppend: true
path: /data/mongodb/mongos/log/mongos.log

net:
port: 20000
bindIp: 0.0.0.0


processManagement:
timeZoneInfo: /usr/share/zoneinfo

security:
keyFile: /data/mongodb/conf/key
clusterAuthMode: keyFile


replication:
localPingThresholdMs: 15

sharding:
#监听的配置服务器,只能有1个或者3个 configs为配置服务器的副本集名字
configDB: "configs/10.20.71.135:21000,10.20.73.182:21000,10.20.70.61:21000"
2. 制作服务启动文件

root@mgo-db01cn-p001:/data/mongodb/conf# cat /lib/systemd/system/mongos.service
[Unit]
Description=MongoDB Mongos Database Server
After=network.target
Documentation=https://docs.mongodb.org/manual

[Service]
User=mongodb
Group=mongodb
EnvironmentFile=-/etc/default/mongod
ExecStart=/usr/bin/mongos --config /data/mongodb/conf/mongos.conf
PIDFile=/data/mongodb/mongos/log/mongos.pid
# file size
LimitFSIZE=infinity
# cpu time
LimitCPU=infinity
# virtual memory size
LimitAS=infinity
# open files
LimitNOFILE=64000
# processes/threads
LimitNPROC=64000
# locked memory
LimitMEMLOCK=infinity
# total threads (user+kernel)
TasksMax=infinity
TasksAccounting=false

# Recommended limits for for mongod as specified in
# http://docs.mongodb.org/manual/reference/ulimit/#recommended-settings

[Install]
WantedBy=multi-user.target
启动方式一:

root@mgo-db01cn-p001:/data/mongodb/conf# systemctl daemon-reload
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl enable mongos
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl start mongos.service
root@mgo-db01cn-p001:/data/mongodb/conf# systemctl status mongos.service
启动方式二:

mongod -f /data/mongodb/conf/shard3.conf
3. 启用分片 目前搭建了mongodb配置服务器、路由服务器,各个分片服务器,不过应用程序连接到mongos路由服务器并不能使用分片机制,还需要在程序里设置分片配置,让分片生效。

mongo --port 20000

#使用admin数据库
use admin

#串联路由服务器与分配副本集
sh.addShard("shard1/10.20.71.135:27017,10.20.73.182:27017,10.20.70.61:27017")
sh.addShard("shard2/10.20.71.135:27018,10.20.73.182:27018,10.20.70.61:27018")
sh.addShard("shard3/10.20.71.135:27019,10.20.73.182:27019,10.20.70.61:27019")

#查看集群状态
sh.status()
⚠️ : 集群服务启动顺序 mongodb的启动顺序是,先启动配置服务器,在启动分片,最后启动mongos. configsvr->shard->mongos 至此,整个mongodb高可用集群就搭建好了。

部署测试

1. 先建一个database及user创建数据

# 创建一个admin用户
$ mongo --port 20000
> use admin
> db.createUser({ user: "weadmin", pwd: "123456",roles: [{ role: "userAdminAnyDatabase", db: "admin" },{ role: "clusterManager", db : "admin"}],passwordDigestor: "server"})
> exit

# 创建一个database的访问用户
$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use test
> db.createUser({user: "test",pwd: "123456",roles: [{ role: "dbOwner", db: "test" }],passwordDigestor: "server"});
> exit

# 使用该用户访问database,并插入数据,创建索引
$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
#插入测试数据
> for (var i = 1; i <= 5000; i++){db.table1.save({id:i,"name":"shuke"})};
> exit
2. 分片生效 目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了,但我们的目的是希望插入数据,数据能够自动分片。连接在mongos上,准备让指定的数据库、指定的集合分片生效。

$ mongo --username weadmin --password 123456 --authenticationDatabase admin --port 20000 admin
> use admin
# 认证
> db.auth("weadmin", "123456")
#指定testdb分片生效
db.runCommand( { enablesharding :"test"});
#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : "test.table1",key : {id: 1} } )
我们设置testdb的 table1 表需要分片,根据 id 自动分片到 shard1 ,shard2,shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表 都需要分片!

3. 测试分片配置结果:

$ mongo --username test --password 123456 --authenticationDatabase test --port 20000 test
> use test
> db.auth("test", "123456")
#查看分片情况
> db.table1.stats();
总结

手工部署mongodb集群还是比较麻烦的,所以如果图省事儿,还是使用云厂商提供的PaaS服务好了,比如云数据库 MongoDB。如果一定要自己搭建,还是建议用现成的ansible-mongodb-cluster脚本好了。