申請免費試用、咨詢電話:400-8352-114
Amteam.org
一次旅行外出登機找座位的經歷使我至今記憶猶新。那天,登機牌座位號是9E,登機后我走到客艙的第9排,“A、B、C、D、E”我從左邊數過來第五個坐位很自然地就坐下了。這時,一個老外沖我走了過來,“對不起,你坐了我的座位。”我明白他講的英語。我一愣,“你確信嗎?”我掏出我的登機牌,“我的是9E,你的呢?”我在他面前晃了晃,心想“老外肯定沒看清座位號碼。”“我的是9F”老外很認真地說。“那應該是在旁邊呀”,我指指右手邊的座位。“No,no ,no”,老外的腦袋搖地像波浪鼓似的??吹桨l(fā)生爭執(zhí),坐在9C的另一個老外站起來, “我的坐位是C,這個座位應該是E。” 顯然是支持我的,我更得意了。講英語的老外指了指頭頂的座位標識牌,“C、E、F”。我一看,傻了,人家是對的。原來我們所在的是前艙靠近機頭位置,比較窄,座位少了一個,所以坐位編號從C就直接跳到了E,沒有中間的D。原來是我弄錯了,連忙道歉“Sorry”。顯然,我是憑經驗在找作為,而老外是老老實實在看頭頂位置的座位標識牌。結果帶有一絲“經驗主義”的我卻找錯了座位。
這次經歷使我不由地聯想到規(guī)則和經驗的問題,現實工作中,我們或多或少會遇到此類問題。在IT運維中,也存在類似的現象,“規(guī)則”和“經驗”仿佛一對孿生兄弟,共同影響著運維工作。我們很難說運維中是規(guī)則重要還是經驗重要,因為它們總是在不同的方面影響IT運維的整體效果。
“規(guī)則”是IT運維之基礎,日常的運維工作如果離開規(guī)則的約束,運行效果將會被運維人員個人的工作能力所左右,很難控制。正因為如此,目前各級運維部門都針對自身工作特點制定了一系列的運維規(guī)則,如機房管理規(guī)定、值班制度、巡檢制度、問題處理規(guī)程等等。正是這些制度的實行使IT運維效果有了基本保障。
相對于規(guī)則,“經驗”可以說是IT運維中解決突發(fā)問題,發(fā)現系統存在隱患的“利器”。特別是在IT突發(fā)事件中,更能體現運維經驗的重要性。而且,通過運維人員自身的經驗積累,查找隱藏在系統深處的潛在隱患,可以使IT系統更加穩(wěn)定、健壯,并減少故障發(fā)生的頻率。
其實,在IT運維實際工作中,“規(guī)則”與“經驗”都是不可缺少的,它們一個是“正規(guī)軍”、一個是“特種兵”。“規(guī)則”是“正規(guī)軍”,是用來打常規(guī)戰(zhàn)爭,解決運維中的一般問題的。比如我們的值班制度、機房管理制度、應急預案等等都屬于規(guī)則的范疇。遇到問題的時候,我們查找這些規(guī)則就很容易找到解決問題的辦法,使信息系統穩(wěn)定運行。“經驗”是“特種兵”,是用來執(zhí)行特殊任務的,它是我們在日常運維工作中形成的各種知識的積累。一般來說,這種經驗對于每位工程師都是不同的,而且沒有固化成文字記錄。運維中,我們需要靈活運用這兩種手段來保障系統運行。
筆者總結以往自身的IT運維經驗,認為以下做法可以達到比較好的運維效果:
一、建立運維規(guī)則,強化制度管理
據統計,IT運維中90%以上的工作都屬于日常管理工作。應對這些工作的最好辦法也就是設立有效的規(guī)章制度。盡可能地把日常的所有工作都納入制度中,以制度去約束日常地運維行為。
二、培養(yǎng)運維人員的經驗,應對突發(fā)事件
由于IT系統的日益復雜,運維中除了日常管理工作外,運維人員將不可避免地扮演“救火隊員”的角色,處理系統的突發(fā)故障。此時工程師的運維經驗就顯得十分重要。因此,工作中除了要應對日常事件外,還需要工程師盡可能地拓寬技術視野,進行技術儲備,達到增加運維經驗的目的。
三、不斷將經驗轉化為規(guī)則
由于“經驗”更多地是建立在運維人員個人工作經歷上的,并且鮮有文字的記錄,因此,系統的穩(wěn)定運行不可避免的對某些關鍵運維人員產生了強烈的依賴。如果一旦此人離開工作崗位,后果將不堪設想。最好的辦法是把這些經驗進行總結,逐漸歸納成文字保存,并在適當的時候加入到規(guī)則中,這樣后人在學習規(guī)則的時候也就間接具有了這種經驗。
對于IT運維而言,“規(guī)則”與“經驗”均具有十分重要的意義。“規(guī)則”是我們系統得以“長治久安”的基礎,而“經驗”可以在應對突發(fā)事件中起到“奇兵”之效果。如果在實踐中,我們能夠不斷將一些有益的“經驗”融入到制度中,逐步轉化為“規(guī)則”,那么就能更好地達到不斷完善規(guī)則、強化管理的目的。
|