IBM認證知識:HACMP心跳檢測
與在許多其他類型的集羣中一樣,心跳檢測用於監視網絡接口、通信設備和 IP 標籤(服務、非服務和持久 IP 標籤)的可用性,從而監視節點的可用性。
從 HACMP V5.1 開始,心跳檢測完全基於 RSCT 拓撲服務(因而 HACMP V5.1 只是“Enhanced Scalability”版本;使用直接由集羣管理器守護進程監視的傳統網絡接口模塊 (NIM) 的心跳檢測已不再使用)。
執行心跳檢測的方法是通過每個通信接口或設備在集羣中的節點之間交換消息(Keep Alive 數據包)。
每個集羣節點以特定間隔向其他集羣節點發送心跳信號消息,並預期以特定間隔接收來自對應節點的心跳信號消息。如果消息接收停止,則 RSCT 將此情況視爲故障,並告訴 HACMP,後者將採取適當的恢復操作。
心跳信號消息可通過以下網絡發送:
TCP/IP 網絡點對點非 IP 網絡爲了防止集羣分割(split brain),HACMP 必須能夠區分節點故障和 TCP/IP 網絡故障。TCP/IP 網絡故障可能由有故障的網絡元素(交換機、集線器和電纜)導致;在這種情況下,集羣中的節點不能通過 IP 發送和接收檢測信號消息(Keep Alive,KA),因此每個節點認爲對等節點發生了故障,並嘗試獲取資源。這具有潛在的數據破壞風險,在使用併發資源時尤其是如此。
非 IP 網絡是節點之間的直接連接(點對點),並且不使用 IP 來進行檢測信號消息交換,因此不太容易受到 IP 網絡元素故障的影響。如果使用了這些網絡類型,則在 IP 網絡發生故障的情況下,節點仍然能夠交換消息,因此得出的判斷是網絡故障,從而不執行任何資源組活動。
爲了避免 HACMP 中發生分割,我們建議:
配置冗餘網絡(IP 和非 IP)同時使用 IP 和非 IP 網絡。若要了解一個建議的兩節點集羣配置,圖 3。
圖 3 HACMP 集羣中的信號檢測
通過磁盤的信號檢測
通過磁盤的心跳檢測 (diskhb) 是 HACMP V5.1 中引入的新功能,旨在提供預防集羣分割的附加保護和簡化的非 IP 網絡配置,尤其是用於太難或無法實現 RS232、目標模式 SSA 或目標模式 SCSI 連接的環境。
此類網絡可以使用任何類型的共享磁盤存儲(光纖通道、SCSI 或 SSA),只要用於交換 KA 消息的磁盤是 AIX 增強併發卷組的一部分。用於信號檢測網絡的磁盤並不專門用於此目的;可以將它們用於存儲應用程序共享數據(有關更多信息,請參見圖 3)。
客戶提出了使用目標模式的光纖通道連接請求,但是由於異構(非標準發起設備和目標功能)的 FC 環境(適配器、存儲子系統、SAN 交換機和集線器),此方法很難實現和支持。
通過使用共享磁盤來交換消息,非 IP 網絡的實現更加可靠,並且不依賴所使用的硬件類型。
此外,在 SAN 環境中,當使用光纖來連接設備時,這種非 IP 連接的長度具有與 SAN 相同的距離限制,
因而允許實現超長的點對點網絡。
通過將某個磁盤定義爲增強的併發卷組的一部分,該磁盤的一部分(扇區)將不用於任何 LVM 操作,此磁盤部分將用於在兩個節點之間交換消息。
使用通過磁盤的信號檢測的規範如下:
一個磁盤可用於兩個節點之間的一個網絡。同時在兩個節點上使用 LVM 分配的物理卷 ID(physical volume ID,PVID)來標識要使用的`磁盤。用於磁盤信號檢測網絡的建議配置是在每個存儲機箱中將一個磁盤用於一對節點。要求將要使用的磁盤是某個增強併發卷組的一部分,雖然該卷組不一定要是活動的或者是某個資源組(併發或非併發)的一部分。唯一的限制在於,必須同時在兩個節點上定義該卷組(volume group,VG)。注意:增強併發卷組的集羣鎖機制不使用保留磁盤空間來進行通信(“傳統”版本的 clvmd 要使用保留磁盤空間);它改爲使用 RSCT 組服務。
通過 IP 別名的心跳檢測
對於 IP 網絡,現在引入了一個新的心跳檢測功能:通過 IP 別名的信號檢測。此功能是爲不能或不適宜更改通信接口的基本 IP 地址的集羣而提供的。
用於信號檢測的 IP 別名是在 HACMP 服務啓動時在現有 IP 地址之外配置的。用於此目的的 IP 地址必須與現有的 IP 地址在完全不同的子網中,並且不應該定義用於任何名稱解析(/etc/hosts、BIND 等等)。此配置不需要任何附加的可路由子網。
與使用基本/啓動 IP 地址來交換心跳信號消息不同,RSCT 使用 HACMP 定義的 IP 別名來爲每個通信接口建立通信組(檢測信號環)。
注意:在使用通過 IP 別名的心跳檢測時,通信接口的基本/啓動 IP 地址由不由RSCT 拓撲服務(從而由 HACMP)進行監視。通信接口將通過所分配的 IP 別名接受監視。
即使使用此技術,HACMP 仍然要求網絡上的所有接口(所有節點中的接口)能夠彼此通信(能夠彼此看到對方的 MAC 地址)。
用於 IP 別名的子網掩碼與用於服務 IP 地址的子網掩碼相同。在定義用於信號檢測的 IP 地址時,必須指定要用於信號檢測的起始地址,並且必須確保有足夠多與網絡上使用的現有子網不發生衝突的子網可用(節點中的每個物理通信接口對應一個子網)。
相關文章
-
IBM的HACMP認證知識:HACMP的規劃
一、活動主題黃河水院旅遊系share together with girl女生主題活動二、活動背景新的學期開始了,在春天來到的時刻,爲了能夠調動同學參與活動的積極性,充分展示自己的魅力,結合本系的特色,舉辦一次關於女生的活動,希望 -
IBM認證知識:HACMP術語
在日常生活或是工作學習中,大家總免不了要接觸或使用作文吧,藉助作文可以宣泄心中的情感,調節自己的心情。那麼你知道一篇好的作文該怎麼寫嗎?下面是小編爲大家整理的二十年後的家鄉作文,僅供參考,大家一起來看看吧。二十年 -
IBM認證知識:HACMP集羣規劃
集羣規劃也許是實現成功的配置過程中最重要的步驟。HACMP 規劃應該包括以下方面:硬件規劃節點網絡存儲軟件規劃操作系統版本HACMP 版本應用程序兼容性測試和維護規劃測試過程變更管理管理操作硬件規劃實現高可用性配置 -
IBM認證知識:HACMP網絡安全規劃
規劃網絡安全性對於避免集羣節點上未經授權的訪問也是非常重要的。從 HACMP V5.1 開始,通過爲節點之間所有與 HACMP 配置相關的通信提供公共通信基礎設施(守護進程),從而引入了一種新的安全機制。新的集羣通信守護進程 -
IBM認證HACMP概述
High Availability Cluster Multi-Processing for AIX (HACMP) 基本軟件產品處理部分連續操作問題。它處理單個站點的計算聯合體中的計算機、適配器或局域網的故障恢復。 HACMP/XD:HAGEO 組件該軟件具有三個重要功 -
HACMP認證知識:共享LVM要求
HACMP 集羣的共享 LVM 規劃取決於共享磁盤訪問方法和共享磁盤設備的類型。應該爲共享 LVM 考慮的元素包括:數據保護方法存儲訪問方法存儲硬件冗餘注意:HACMP 本身不提供存儲保護。存儲保護是通過以下途徑提供的:AIX(LVM -
HACMP認證知識:資源組類型
級聯資源組級聯資源組定義了可控制該資源組的所有節點的列表,以及每個節點在接管該資源組方面的優先級。級聯資源組的行爲如下:在集羣啓動時,在缺省情況下,級聯資源組在其主節點(在該節點組中具有最高優先級的節點)上 -
HACMP認證知識:資源組規劃
資源組是一個邏輯實體,其中包含 HACMP 要使其高度可用的資源。資源可以是:存儲空間(應用程序代碼和數據)文件系統網絡文件系統原始邏輯卷原始物理磁盤服務 IP 地址/標籤(由客戶端用於訪問應用程序數據)應用程序服務器應 -
HACMP認證知識:應用程序監視
除了資源組管理以外,HACMP 還可以通過以下兩種方法之一監視應用程序:應用程序進程監視:使用 RSCT 事件管理功能檢測進程是否終止。應用程序自定義監視:基於您定義的監視方法(程序或腳本)來監視應用程序的運行狀況。注意:不 -
HACMP認證知識:災難恢復計劃
從 HACMP V5.1 開始,HAGEO 和 GeoRM 已作爲 IBM HACMP/XD(擴展距離)功能集成到 HACMP 中。HAGEO 軟件產品提供了一個用於構建容災計算環境的靈活、可靠的平臺。HAGEO 組件可以通過 TCP/IP 點對點網絡在無限距離的地理