服務器集群的故障檢測(三)
- 作者:新網
- 來源:新網
- 瀏覽:100
- 2018-02-24 17:17:38
如果資源在當前主機節點上,是不可操作的,并且還不同重新啟動,則集群服務會認為此資源發生了故障,而群集服務按照以下方式檢測資源的故障,廢話不多說一起看看吧!
如果資源在當前主機節點上,是不可操作的,并且還不同重新啟動,則集群服務會認為此資源發生了故障,而群集服務按照以下方式檢測資源的故障,廢話不多說一起看看吧!
<
div>(1)在周期性的時間間隔內,集群服務檢查資源以了解資源是否可操作。集群服務通過定期調用資源監視器來完成此項任務。反過來,資源監視器則依賴于每個資源的資源主動態鏈接庫( DLL)執行一段過程以檢測資源是否正常工作。資源 DLL 通過資源監視器將結果傳給集群服務。可以通過設置“Looks Alive”和“ls Alive ,輪詢間隔來指定集群服務檢資資源故障的頻率。集群服務在每個“ls Alive ”時間間隔內請求對資源 的狀態進行比“Looks Al ive" 間隔內所傲的更徹底的檢查。“ls Alive”輪詢問隔通常比“Looks Alive”輪詢問隔長。
(2)如果資源 DLL 報告資源不可操作,那么集群服務會嘗試重新啟動資源。可以指定集群服務在一給定時間間隅內嘗試重新啟動資源的次數如果集群服務在指定的時間向陸內所做的嘗試的數量超過了最大重新啟動嘗試次數,但是資源仍不可操作,那么集群服務會認為資源出了故障。
可以配置是否故障資源引起包含該資源的組故障轉移到其他節點。如果故障資源配肯為引起包含該資源的組故障轉移到其他節點,那么集群服務將嘗試故障轉移。如果故障轉移嘗試次數坦過組的闕值而資源仍然處在故障狀態,則集群服務將嘗試資源的重新啟動。在資源的“故障重試周期”屬性(所有資源的一個一般屬性)指定的周期結束后,將做重新啟動嘗試。集群服務開始對資源嘗試重新啟動然后故障轉移。
雖然“故障重試周期”屬性的單位是ms,但按分鐘順序選擇值。還可以選擇比資源重新啟動周期屬性值大的或者相等的值并強制執行這個規則。