突破傳統的人工重啟方式 |
隨著IT技術的發展,各行各業局域網、廣域網和互連網的也在普遍實施。絕大多數單位都有了自己的網站,各系統也建立了自己的網絡。因此,對系統的可靠性要求也提高了。 不知大家是否聽說過“帶外管理”這個名詞,是新一代網絡管理技術的簡稱。而所謂的帶外管理,就是不依托于遠程設備自身的操作系統和網絡接口,不使用遠程設備的原有網絡資源,而是通過重新建立的旁路來實現新的管理鏈路的連接。其帶外管理能夠使用戶:減少運營成本、提高運營效率、減少 機時間、提高服務質量。
傳統的人工重啟往往是等到服務器、交換機等用電設備出現了故障,不能正常供電,才由值班人員去查找故障所在,并進行簡單的手動重啟。這樣勢必耗費很多寶貴的時間,而且很多場合也是不允許的。頻繁進出機房進行人工重啟,不僅對機房恒溫恒濕的環境造成破壞,對工作人員的身體健康造成一定威脅,浪費了大量工作時間和精力,而且也會對機房內的相關保密性工作造成影響。
要知道服務器、交換機等用電設備每天高速高負荷的運轉,死機現象已經成為機房最普遍最常見的問題,管理員不得不每天都要進出機房對死機的服務器進行最簡單的重啟動作或者故障檢修和維護。對于那些大型機房服務器重啟將會是更為繁瑣的工作,機房管理員得知服務器發生死機情況后,需要首先查到該服務器所在的機柜位置,然后進入充滿輻射的、面積很大的機房,有時可能還要小心繞過機房內密密麻麻的線纜,這一系列的重啟工作就好像連環套,每個環節都不可掉以輕心,這樣才完成這一簡單的重啟工作。況且中間環節消耗時間較長,人為出現失誤的機率也較高,到最終恢復訪問,一般也需要等待15分鐘以上,甚至會更久。
目前業界的狀況是,只能手動重啟,如此一來機房就必須有人值班,必須全天候盯梢。可是這種傳統的人工重啟方式往往令人難以駕馭。尤其是在時間錯位或地域限制的情況下,例如對于深夜/節假日的設備管理、異地/偏遠/環境惡劣的基站/基點的設備的開/關/重啟控制。
其實對于服務器、交換機等用電設備的重啟問題,完全可以利用遠程管理的方式給予解決,不過大多數朋友所說的遠程管理方式是基于軟件來實現的,也就是說通過第三方軟件遠程控制設備實現的,廣泛應用于執行常規性管理任務,并用來監測各種網絡錯誤和程序錯誤—非硬件錯誤或操作系統錯誤。但這種管理方式太依賴網絡本身了,只有在遠程被管理設備的操作系統、網絡接口設備均正常時才可以使用。這就是人們所謂的“帶內管理”。
帶外管理,這種先進的網絡管理技術被傲視恒安所運用,并且自主研發了新一代網絡電源控制產品——RPDU。它可以通過遠程的方式,很好的解決服務器的重啟問題,彌補了網管軟件所不能涉及的電源管理部分,可以說是電源史上一個飛躍。
只需通過web頁面訪問就可以直觀地查看、管理和控制網絡環境內任意控制器上的任意受控端口所連接設備的電源狀況,從而實現遠程重啟。客戶服務人員(值班網管人員)只需要一臺電腦,就能輕松地為用戶的服務器進行重啟。如此一來,就不用將太多的人力投入到簡單而又毫無技術含量的重啟工作中去了,從而可以合理地分配人力資源。
另外很多時候往往因為故障發生不能得到及時的解決而造成不必要損失,解決問題(服務器死機)的最好方法,是及時發現+有效地解決,二者缺一不可。然而這正是RPDU智能性的體現,RPDU的數字化管理平臺可對RPDU下聯的電子設備進行自動檢測設置。需要說明的是,這里說的自動檢測不僅僅是指電子設備所出現的死機或宕機故障,同時對于服務器所應用的各種服務也可設置自動檢測功能,如:“ICMP”、“HTTP”、“TELNET”、“FTP”、“POP3”、“SMTP”、“HTTPS”等;如果出現服務器應用服務停止或網絡設備運行宕機等故障,RPDU遠程電源控制系統可根據預設方案進行自動重啟快速而有效地排除故障。
現在機房的發展趨勢就是對電子設備的遠程集中化管理,在國外遠程集中化管理早已成為機房必備的機房管理手段。像RPDU這樣的智能設備很早就進入了機房管理的行列,并且成為網絡管理員們很好的助手。在筆者看來在我國,IDC行業正處于發展階段,服務器運營商們不盲目地去追求利益的回報,卻忽視了機房管理這個必要的運營手段。因此筆者在此向朋友們闡述了RPDU的功能,只希望幫助更多的朋友們!