摘要:當傳統(tǒng)工業(yè)遇上現(xiàn)代技術(shù),如何平衡兩者之間的關(guān)系,使之和諧共進,煥發(fā)更強生機?
項目背景
包頭鋼鐵(集團)有限責任公司(以下簡稱:包鋼)是我國成立后最早建設(shè)的鋼鐵工業(yè)基地之一,1954年開始建設(shè),1959年投產(chǎn)。包鋼擁有“包鋼股份”和“包鋼稀土”兩個上市公司,是中國主要的鋼軌及無縫鋼管生產(chǎn)基地之一、華北地區(qū)最大的板材生產(chǎn)基地、是世界稀土工業(yè)的發(fā)端和最大的稀土科研、生產(chǎn)基地。
包鋼始終致力于多元發(fā)展,并致力于建設(shè)“大包鋼”,成為世界最大的稀土鋼生產(chǎn)基地和最具競爭力的稀土生產(chǎn)、科研基地,年銷售收入達到1000億元以上。
隨著包頭鋼鐵(集團)有限責任公司信息化建設(shè)的深入, 信息化運維監(jiān)控管理在企業(yè)發(fā)展過程中擔負起越來越重要的角色,企業(yè)利潤來源也越來越依賴于信息化的建設(shè)水平,而企業(yè)信息化的建設(shè)水平取決于兩個方面:
如何及時了解系統(tǒng)的運行狀況,有效地降低系統(tǒng)運行的風險,主動的發(fā)現(xiàn)并及時解決系統(tǒng)運行故障,讓業(yè)務(wù)系統(tǒng)保持7×24小時的健康、持續(xù)、穩(wěn)定、高效運行,這些都給包鋼的信息化運維管理水平提出了更高的要求,也是當前傳統(tǒng)工業(yè)企業(yè)運維管理普遍面臨的巨大挑戰(zhàn)。
運維挑戰(zhàn)
包鋼集團 目前擁有網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲以及其他IT資源,在整個IT資源管理方面仍處于人工管理階段,管理運維屬于被動管理。
管理設(shè)備類型和數(shù)量
– 交換機主要為cisco和H3C交換機,共計需要管理80臺。
– 操作系統(tǒng)主要有IBM AIX、CentOS、Windows等,共計需要管理35臺。
– 數(shù)據(jù)庫主要為IBM DB2、Oracle等,共計需要管理 25套。
– 中間件主要為websphere,需要管理10套。
– 應(yīng)用主要為HTTP,需要管理10套。
– 存儲設(shè)備主要為IBM、EMC,需要管理5臺。
運維管理需求:
網(wǎng)絡(luò)管理
數(shù)據(jù)庫管理
中間件管理
標準應(yīng)用管理
存儲管理
解決方案
BTSO以自動學習、自動分析、自動運維詮釋智能運維的運維方法。自動學習:實現(xiàn)用戶環(huán)境數(shù)據(jù)的學習,結(jié)合內(nèi)置檢測指標體系,建立具有用戶特征的常態(tài)健康標準;自動分析:實時監(jiān)控用戶各項運維指標,結(jié)合指標變化特征,通過諸如單指標越界比例、多指標組合判斷、歷史趨勢變化等方法自動判斷數(shù)據(jù)異常情況,主動提醒;自動運維:提供處置方案的提醒,用戶處置程序的調(diào)用等多種方案,實現(xiàn)異常問題的及時處理和運維。
傳統(tǒng)系統(tǒng)監(jiān)控的訪問方式為告警,但是面對設(shè)備日趨完善,管理對象超過閾值的告警越來越少,如何實現(xiàn)信息化管理價值的最大化呢?這是擺在信息化管理管理主管面前的最大課題。北塔公司結(jié)合用戶信息化管理實際情況,發(fā)現(xiàn)信息化管理價值最大化的方式有如下方面:
BTSO核心管理方式就是智能化管理,智能化的理論基礎(chǔ)是北塔十幾年的信息化管理經(jīng)驗和幾千家用戶的管理實踐,為把這些管理方案推送到用戶現(xiàn)場,BTSO提供了智能信息化管理模板。
智維模板按照管理等級,預置了不同管理對象的管理方案,方案包含如下技術(shù)點:
通過上述智維模板,使軟件無需復雜配置,安裝就能對資源進行基礎(chǔ)信息化管理。
實施效果
運維智能分析
BTSO自動對管理對象進行數(shù)據(jù)收集,用戶進行數(shù)據(jù)對比分析,系統(tǒng)也提供智維分析的周統(tǒng)計,智能的挖掘系統(tǒng)的問題隱患。
提供本周系統(tǒng)運行概要信息:
提供各個管理類型的運維巡檢情況:
提供各類重要類型的上周高低負載的數(shù)量;了解整體性能概況;
提供在告警處置上的效能評估,告警數(shù)量的變化以及平均解決時長的增長;
提供對于本周運行數(shù)據(jù)的分析判斷,便于用戶定位問題:
對于工程師日常監(jiān)控來說,故障管理是突發(fā)情況,而關(guān)鍵業(yè)務(wù)、指標的監(jiān)控是常態(tài)管理要求,為了滿足工程師對于重點應(yīng)用質(zhì)保的監(jiān)控要求,系統(tǒng)提供了自定義首頁功能,該功能提供基于角色的個性展示功能,用戶可以自行選擇不同管理重點指標以及展現(xiàn)方式,以便完成一圖完成所有重點監(jiān)控;
系統(tǒng)至少提供TOP表格、TOP柱狀圖、性能曲線圖、單值圖等多種展示方式;支持對于所有數(shù)值型數(shù)據(jù)的統(tǒng)一排序、歷史記錄展示;
結(jié)合日常管理需求。可以實現(xiàn)諸如骨干線路監(jiān)控總圖、關(guān)鍵應(yīng)用監(jiān)控視圖的管理要素;
系統(tǒng)為展示要求提供數(shù)據(jù)支撐,能為自定義布局提供技術(shù)支撐,管理展現(xiàn)提供數(shù)據(jù)支撐。除了所以采集范圍內(nèi)的指標外,也應(yīng)該支持通過sql、ssh、snmp等方式擴展業(yè)務(wù)指標的顯示;
系統(tǒng)應(yīng)該提供基于一個角色同時查看和配置多張視圖的能力,每張視圖可以新窗口打開,為用戶日常監(jiān)控展示提供便利性。
直觀明了的網(wǎng)絡(luò)管理
自動根據(jù)北塔特有的拓撲生成算法,快速搜索整個網(wǎng)絡(luò)內(nèi)的網(wǎng)絡(luò)設(shè)備,智能分析網(wǎng)絡(luò)拓撲結(jié)構(gòu),自動勾畫出整個網(wǎng)絡(luò)的真實物理拓撲圖,真實反映整個網(wǎng)絡(luò)的構(gòu)成狀況。BTSO 除拓撲生成之外,還支持拓撲添加功能,在保留原有拓撲圖的基礎(chǔ)上,搜索新的網(wǎng)絡(luò)設(shè)備,并自動添加到網(wǎng)絡(luò)拓撲圖上。
網(wǎng)絡(luò)拓撲圖可從全局的角度出發(fā),幫助信息化管理管理人員實時了解整個網(wǎng)絡(luò)當前的運行狀況,主動告訴用戶關(guān)注點應(yīng)在哪里,網(wǎng)絡(luò)架構(gòu)是否合理,有無網(wǎng)絡(luò)瓶頸,設(shè)備和流量有無異常等,動態(tài)告訴用戶可能的故障隱患,達到透明化、事前管理目的。
為了同時滿足不同用戶間的個性化需求,BTSO 提供了靈活的拓撲圖復制功能,可為不同用戶提供單獨的展現(xiàn)頁面。用戶可以根據(jù)自己的偏好設(shè)置自己的個性化拓撲圖,且不同的用戶之間沒有任何影響。
提供背景圖的更換設(shè)置功能,可自由選擇精美的圖片作為拓撲圖的背景;
直觀展示主機系統(tǒng)關(guān)聯(lián)關(guān)系的系統(tǒng)拓撲
系統(tǒng)拓撲以主機為核心,展現(xiàn)了所有承載的數(shù)據(jù)庫和中間件、標準應(yīng)用之間的實時狀態(tài)監(jiān)控, 為主機監(jiān)控提供全景視圖;系統(tǒng)自動生成并智能布局,無需人工調(diào)整。
系統(tǒng)拓撲提供清晰的展現(xiàn)方式:提供網(wǎng)段不同顏色表示方式,不同主機按照其操作類型圖標 顯示,從主機出發(fā)關(guān)聯(lián)數(shù)據(jù)庫與主機的關(guān)系。
同時提供主機一體化顯示,按照不同的操作系統(tǒng)進行數(shù)據(jù)分類,系統(tǒng)提供基礎(chǔ)信息、運行信息、進程管理、事件與告警、硬件信息等各類管理信息:
透明化、智能化、統(tǒng)一化的存儲管理
基于北塔的管理平臺,以空間、硬件、性能 3 個方面為管理抓手,為用戶提供透明化、智能化、統(tǒng)一化管理,提高存儲運維管理效率;系統(tǒng)支持磁盤陣列、 光纖交換機的管理, 支持 SAN/NAS等各種部署方式;
硬件狀態(tài)管理作為基礎(chǔ)管理部分,以統(tǒng)一的視圖展現(xiàn)被管的各個硬件子項的運行詳情,清晰展現(xiàn)各個管理設(shè)備的各類型管理狀態(tài),并以顏色顯著標示出現(xiàn)問題的硬件類型;涉及到磁盤陣列的電源、電池、風扇、溫度、磁盤、控制器等各個關(guān)鍵硬件信息;