MongoDB集群有副本集及主從復(fù)制兩種模式,不過主從模式在MongoDB 3.6已經(jīng)徹底廢棄,今天主要探討副本集的搭建和使用,以及分片。

副本集介紹
副本集(Replica Set)即副本的集合,在MongoDB中通過先定義一個副本集合,然后將多個節(jié)點(diǎn)(副本)加入到這個集合中。簡單來說就是集群中包含了多份數(shù)據(jù),保證主節(jié)點(diǎn)掛掉,備節(jié)點(diǎn)能夠繼續(xù)提供數(shù)據(jù)服務(wù),實現(xiàn)MongoDB的數(shù)據(jù)備份及高可用。
副本集具有以下特征:
- N 個節(jié)點(diǎn)的集群
- 任何節(jié)點(diǎn)可作為主節(jié)點(diǎn)
- 所有寫入操作都在主節(jié)點(diǎn)上
- 自動故障轉(zhuǎn)移
- 自動恢復(fù)
副本集搭建
條件有限,我們在單機(jī)上,通過三個不同的MongoD線程來搭副本集。

主節(jié)點(diǎn)配置如下:
副本節(jié)點(diǎn)的配置和主節(jié)點(diǎn)的基本一致,需要修改一下數(shù)據(jù)庫/日志/PID路徑和端口號,副本集名稱需一致:
依次啟動三個mongod進(jìn)程:
在主節(jié)點(diǎn)中,先使用rs.initiate()方法進(jìn)行副本集初始化操作,再使用rs.add()方法來添加副本集的成員:
到此,MongoDB副本集部署完成,我們可以通過rs.status()命令查看副本集狀態(tài)。
副本集高可用
集群中的各節(jié)點(diǎn)還會通過傳遞心跳信息來檢測各自的健康狀況。當(dāng)主節(jié)點(diǎn)故障時,多個從節(jié)點(diǎn)會觸發(fā)一次 新的選舉操作,并選舉其中的一個成為新的主節(jié)點(diǎn)(通常誰的優(yōu)先級更高,誰就是新的主節(jié)點(diǎn)),心跳信息默認(rèn)每 2 秒傳遞一次。

客戶端連接到副本集后,不關(guān)心具體哪一臺機(jī)器是否掛掉。主服務(wù)器負(fù)責(zé)整個副本集的讀寫,副本集定期同步數(shù)據(jù)備份。一旦主節(jié)點(diǎn)掛掉,副本節(jié)點(diǎn)就會選舉一個新的主服務(wù)器。這一切對于應(yīng)用服務(wù)器不需要關(guān)心。

我們可以通過關(guān)閉主節(jié)點(diǎn),測試是否會選舉新的主節(jié)點(diǎn):
我們直接kill掉主節(jié)點(diǎn),進(jìn)入節(jié)點(diǎn)1,看一下當(dāng)前節(jié)點(diǎn)是否是主節(jié)點(diǎn):
可以看到當(dāng)主節(jié)點(diǎn)(127.0.0.1:27017)掛掉之后,主節(jié)點(diǎn)自動切換到從節(jié)點(diǎn)2(127.0.0.1:27019)上。
副本集選舉機(jī)制
副本集中的從節(jié)點(diǎn)在主節(jié)點(diǎn)掛掉后通過心跳機(jī)制檢測到后,就會在集群內(nèi)發(fā)起主節(jié)點(diǎn)的選舉機(jī)制,自動選舉出一位新的主服務(wù)器。
副本集包括三種節(jié)點(diǎn):主節(jié)點(diǎn)、從節(jié)點(diǎn)、仲裁節(jié)點(diǎn)。
- 主節(jié)點(diǎn)負(fù)責(zé)處理客戶端請求,讀、寫數(shù)據(jù), 記錄在其上所有操作的oplog;
- 從節(jié)點(diǎn)定期輪詢主節(jié)點(diǎn)獲取這些操作,然后對自己的數(shù)據(jù)副本執(zhí)行這些操作,從而保證從節(jié)點(diǎn)的數(shù)據(jù)與主節(jié)點(diǎn)一致。默認(rèn)情況下,從節(jié)點(diǎn)不支持外部讀取,但可以設(shè)置,副本集的機(jī)制在于主節(jié)點(diǎn)出現(xiàn)故障的時候,余下的節(jié)點(diǎn)會選舉出一個新的主節(jié)點(diǎn),從而保證系統(tǒng)可以正常運(yùn)行。
- 仲裁節(jié)點(diǎn)不復(fù)制數(shù)據(jù),僅參與投票。由于它沒有訪問的壓力,比較空閑,因此不容易出故障。由于副本集出現(xiàn)故障的時候,存活的節(jié)點(diǎn)必須大于副本集節(jié)點(diǎn)總數(shù)的一半,否則無法選舉主節(jié)點(diǎn),或者主節(jié)點(diǎn)會自動降級為從節(jié)點(diǎn),整個副本集變?yōu)橹蛔x。因此,增加一個不容易出故障的仲裁節(jié)點(diǎn),可以增加有效選票,降低整個副本集不可用的風(fēng)險。仲裁節(jié)點(diǎn)可多于一個。也就是說只參與投票,不接收復(fù)制的數(shù)據(jù),也不能成為活躍節(jié)點(diǎn)。
官方推薦MongoDB副本節(jié)點(diǎn)最少為3臺, 建議副本集成員為奇數(shù),最多12個副本節(jié)點(diǎn),最多7個節(jié)點(diǎn)參與選舉。限制副本節(jié)點(diǎn)的數(shù)量,主要是因為一個集群中過多的副本節(jié)點(diǎn),增加了復(fù)制的成本,反而拖累了集群的整體性能。 太多的副本節(jié)點(diǎn)參與選舉,也會增加選舉的時間。而官方建議奇數(shù)的節(jié)點(diǎn),是為了避免腦裂 的發(fā)生。
選舉過程
副本集的選舉過程大致如下:
得到每個服務(wù)器節(jié)點(diǎn)的最后操作時間戳。每個 mongodb都有oplog機(jī)制會記錄本機(jī)的操作,方便和主服務(wù)器進(jìn)行對比數(shù)據(jù)是否同步還可以用于錯誤恢復(fù)。
如果集群中大部分服務(wù)器down機(jī)了,保留活著的節(jié)點(diǎn)都為secondary狀態(tài)并停止,不選舉了。
如果集群中選舉出來的主節(jié)點(diǎn)或者所有從節(jié)點(diǎn)最后一次同步時間看起來很舊了,停止選舉等待人來操作。
如果上面都沒有問題就選擇最后操作時間戳最新(保證數(shù)據(jù)是最新的)的服務(wù)器節(jié)點(diǎn)作為主節(jié)點(diǎn)。
MongoDB 同步延遲問題
在MongoDB中,所有寫操作都會產(chǎn)生 oplog,oplog 是每修改一條數(shù)據(jù)都會生成一條,如果你采用一個批量update命令更新了 N 多條數(shù)據(jù),那么oplog 會有很多條,而不是一條。所以同步延遲就是寫操作在主節(jié)點(diǎn)上執(zhí)行完后,從節(jié)點(diǎn)還沒有把 oplog 拿過來再執(zhí)行一次。而這個寫操作的量越大,主節(jié)點(diǎn)與從節(jié)點(diǎn)的差別也就越大,同步延遲也就越大了。
分片
當(dāng)MongoDB存儲海量的數(shù)據(jù)時,一臺機(jī)器可能不足以存儲數(shù)據(jù),也可能不足以提供可接受的讀寫吞吐量。這時我們就可以通過在多臺機(jī)器上分割數(shù)據(jù),使得數(shù)據(jù)庫系統(tǒng)能存儲和處理更多的數(shù)據(jù)。
分片集群結(jié)構(gòu)分布:

三個主要組件:
- Shard:數(shù)據(jù)存儲位置,以chunk為單位存數(shù)據(jù),實際生產(chǎn)環(huán)境中一個shard server角色可由幾臺機(jī)器組個一個replica set承擔(dān),防止主機(jī)單點(diǎn)故障;
- Config Server:mongod實例,存儲了整個ClusterMetadata,其中包括 chunk信息,默認(rèn)需要配置3個Config Server節(jié)點(diǎn);
- Query Routers:(Mongos) 前端路由,客戶端由此接入,且讓整個集群看上去像單一數(shù)據(jù)庫,前端應(yīng)用可以透明使用。
Mongos本身并不持久化數(shù)據(jù),Sharded Cluster所有的元數(shù)據(jù)都會存儲到Config Server,而用戶的數(shù)據(jù)會議分散存儲到各個shard。Mongos啟動后,會從配置服務(wù)器加載元數(shù)據(jù),開始提供服務(wù),將用戶的請求正確路由到對應(yīng)的碎片。
Mongos的路由功能:
- 當(dāng)數(shù)據(jù)寫入時,MongoDB Cluster根據(jù)分片鍵設(shè)計寫入數(shù)據(jù)。
- 當(dāng)外部語句發(fā)起數(shù)據(jù)查詢時,MongoDB根據(jù)數(shù)據(jù)分布自動路由至指定節(jié)點(diǎn)返回數(shù)據(jù)。
分片部署
條件有限,我們還是在單機(jī)上,用不同MongoDB線程來部署分片。

分片服務(wù)器
Shard Server和普通Mongod程序一樣,不同的是需要在配置文件中添加shardsvr=true標(biāo)記為Shard Server,配置參考如下:
以上配置復(fù)制4份,修改一下數(shù)據(jù)庫路徑/日志路徑/服務(wù)器IP和端口/PID路徑,啟動4個Shard Server:
配置服務(wù)器
4.0版本的MongoDB中配置服務(wù)器(Config Server)需要設(shè)置副本集,同時設(shè)置configsvr=true,配置參考如下:
啟動Config Server,并初始化副本集:
新版本MongoDB建議設(shè)置多個Config Server,采用副本集形式設(shè)置集群,為了搭建方便,這里我們只采用單個Config Server。
路由服務(wù)器
Router Server不存放數(shù)據(jù),配置參考如下:
啟動Router Server,路由服務(wù)器是由mongos命令啟動,與分片服務(wù)器及配置服務(wù)器不同。
啟動后,需要通過sh.addShard()命令添加分片服務(wù)器:
配置完成后,可以通過sh.status()命令,查看分片情況:
【責(zé)任編輯:武曉燕 TEL:(010)68476606】