優秀的運維架構師應具備哪些能力?

什麼是合格?什麼是優秀?作爲一名優秀的運維架構師要具備哪些能力?YJBYS小編爲大家詳解如下,歡迎查看!

優秀的運維架構師應具備哪些能力?

  合格的運營式運維工程師

首先我們總結下,關於談到何爲一名合格的運維運營工程師,大概就是幾點:

具備一定運營技能;要有運營意識;主動性要強;學習能力要跟得上。

大家都會發現這些條件基本是主觀性方面的佔的多一些,而與客觀沾邊的貌似只有一點:學習能力問題。運營技能差可以培養,運營意識差可以培養,主動性差也可以受環境影響,可以薰陶。

而學習能力完全是一個人綜合能力的體現,這一點個人覺得客觀性佔絕大部分。最近發生的一系列事情,我頗有感觸,合格與不合格的運營工程師就差在這裏,接下來我就簡單的跟大家分享一下。

迴歸到我們OPS生產線運營中來,大家分析一下自己的工作經歷,都會發現我們之前做過一些“傻事”,比如:

運營過程中RM掉lib目錄及關鍵的數據文件目錄;Drop掉數據庫,甚至就連自己遠程管理的服務器,比如做一些安全策略等導致自己也連接不到自己的服務器,諸如此類。

這些都是大家成長的過程,通過時間的推移,我們都能吸取教訓並總結經驗。可以說大家都會經過“0”和“1”的過程,這些貌似我們都沒有什麼區分。

但是,大家有沒有總結一下,“1”到“N”的過程,大家靜下心來仔細想想,自己的“N”是個位數或者是十位數或者甚至是百位數,你會覺得有哪些感觸呢?

我想裏面就能體現你的經驗,更重要的是從這些經驗中學到了多少知識,這些將成爲你的綜合能力素質。

  優秀的運維架構師

迴歸我們的主題,一名OPS架構師,學習能力佔了主要一部分(其實其他行業包括任何事情等等這都是關鍵一點)。如果這塊缺失,僅憑一些生產線的經驗教訓,而不去反思,並充中總結出更多的經驗來,想成爲一個架構師那都是不現實的。

  那麼優秀的OPS架構師我個人覺得有四部分組成:

具備一定的溝通和協調能力;

具有突發故障應急處理能力;

要有不斷反思的能力;

要有很強的知新能力。

下面我們來具體說一下。

  1. 溝通和協調能力

具備一定的溝通和協調能力,這個跟性格有關係,但是,做OPS久了你就會知道,如果你還沒具備一定的溝通和協調能力,那麼趁早撤出這個行業,因爲這個職業不適合你。

我們從OPS的ITIL管理可以看到,幾乎每個流程都是需要溝通和協調的。就拿最基本的變更管理來說,所有的產品上線最後一個關口就是要進入到生產線部署。

那麼,如何協調好研發和測試等資源?做到合理的安排及變更過程中的井然有序?這個完全是OPS的架構師或者說運營工程師來驅動,他會影響變更的成敗。

所以,如果每次變更總是有問題,那麼就要找找自己的問題,這個跟技術能力沒有多大的關係,關鍵在於你是否具備的溝通和協調資源的能力。

  2. 突發故障應急處理能力

具備一定的突發故障的`應急處理能力。這個要求比較高,其實,這個能力主要有兩個體現:要有一定的技術能力;要有生產線運營經驗。

技術能力,後天個人不斷學習去獲取;而生產線運營經驗,這些都是血的教訓得來的,這個就是之前我們說的“N”,不過,並不見得“N”越多越好:

而是“N”中,所有的事故或者事件類型的都不重複,或者說相關類型的不能重複,這是最好的。

也就是,我們要從之前教訓中不斷學習和武裝自己,讓自己變得更強大,每當有新的問題發生或者降臨到你的身上,你具備快速的處理事件的一二三理念,很好的運用事故處理的343法則,這是應急處理的能力的關鍵點。

作爲一名優秀的OPS架構師,毫無疑問以客戶爲導向,服務可持續性爲宗旨,要做的事情就是,快速恢復服務,後續排查問題。這個看得簡單,其實在實際運營中,往往被大家疏忽,所以,這點看,你是否具備了。

  3. 不斷反思的能力

具備反思能力,其實這點說的有點嚴重了。不過,我還是不得不嘮叨幾句。在OPS運營過程中,大家往往都會用任務太多了,事情太多了來搪塞自己、以及領導。

從來沒有靜下心來想想,我這段時間做了什麼?有什麼問題?需要有什麼改進?還會有哪些問題會產生?等等這些問題,我們考慮了多少?不得而知。

設身處地的想想,如果你每天處在忙碌的工作中,除了身心疲憊,還會有什麼?除了嘆氣還是嘆氣。如何改變這個局面,從泥潭中拔出來,不是靠別人,而是靠自己,只有自己想明白了,所有的問題都迎刃而解了。

優秀的OPS架構師,需要時刻關注自己所做的一切,要認真對待每一件事情,任何的生產線的架構調整、細節變化需要記錄下來,一天工作下來需要給自己的腦子休息一下,讓腦子想放電影一樣過一下一天所經歷的事情,哪些是痛點問題,哪些是意外,這些都要整理出來。

這樣長年累月,你就會發現你的知識庫就豐富了,應對生產線的能力也輕鬆的不少。如果現在你覺得生產線運營很累,那請歇歇腳,關注一下這方面的問題。

  4. 很強的知新能力

具有很強的知新能力,這是一個優秀的OPS架構師必備條件,也是我爲什麼放到最後一點來講的一個原因。一般情況下具備前面三個條基本具備了架構師的條件了,可以稱得上是一個OPS架構師了。

那麼,知新能力爲什麼這麼重要?因爲這關係到,是止步於“好”,還是變得“優秀”。

打個比方,好的盤手能夠看到下一步對方怎麼走,會走其中的兩到三步,而優秀的棋盤手卻能看到五步、十步或者更多,這就是好和優秀的區別。

優秀的架構師,在做好生產線運營的同時,他會花很大的盡力來優化平臺架構,來驅動研發來改進平臺,使之做得更好。

同時,他會結合生產線新運營特點及問題,會提出更適合平臺運營的架構,讓平臺做的更好的擴展性,從而提高了這個OPS的運營效率。

另一方面,知新能力就是要有很強的同行業運營現狀的分析能力,能夠很快將市場上的新技術運用到我們的測試環境中,不斷的儲備自己的知識庫,並驅動整個團隊及相關的兄弟部門。

這一點看是很難,其實要做到並不難,難是難在你所維護的生產線穩定了沒有?溫飽問題解決了沒有?如果還沒解決,那離小康生活還有一段距離呢,那就先解決重點問題,做好架構師前面的三點,麪包自然就會有了。

什麼是合格?什麼是優秀?作爲一名優秀的運維架構師要具備哪些能力?YJBYS小編爲大家詳解如下,歡迎查看!

  合格的運營式運維工程師

首先我們總結下,關於談到何爲一名合格的運維運營工程師,大概就是幾點:

具備一定運營技能;要有運營意識;主動性要強;學習能力要跟得上。

大家都會發現這些條件基本是主觀性方面的佔的多一些,而與客觀沾邊的貌似只有一點:學習能力問題。運營技能差可以培養,運營意識差可以培養,主動性差也可以受環境影響,可以薰陶。

而學習能力完全是一個人綜合能力的體現,這一點個人覺得客觀性佔絕大部分。最近發生的一系列事情,我頗有感觸,合格與不合格的運營工程師就差在這裏,接下來我就簡單的跟大家分享一下。

迴歸到我們OPS生產線運營中來,大家分析一下自己的工作經歷,都會發現我們之前做過一些“傻事”,比如:

運營過程中RM掉lib目錄及關鍵的數據文件目錄;Drop掉數據庫,甚至就連自己遠程管理的服務器,比如做一些安全策略等導致自己也連接不到自己的服務器,諸如此類。

這些都是大家成長的過程,通過時間的推移,我們都能吸取教訓並總結經驗。可以說大家都會經過“0”和“1”的過程,這些貌似我們都沒有什麼區分。

但是,大家有沒有總結一下,“1”到“N”的過程,大家靜下心來仔細想想,自己的“N”是個位數或者是十位數或者甚至是百位數,你會覺得有哪些感觸呢?

我想裏面就能體現你的經驗,更重要的是從這些經驗中學到了多少知識,這些將成爲你的綜合能力素質。

  優秀的運維架構師

迴歸我們的主題,一名OPS架構師,學習能力佔了主要一部分(其實其他行業包括任何事情等等這都是關鍵一點)。如果這塊缺失,僅憑一些生產線的經驗教訓,而不去反思,並充中總結出更多的經驗來,想成爲一個架構師那都是不現實的。

  那麼優秀的OPS架構師我個人覺得有四部分組成:

具備一定的溝通和協調能力;

具有突發故障應急處理能力;

要有不斷反思的能力;

要有很強的知新能力。

下面我們來具體說一下。

  1. 溝通和協調能力

具備一定的溝通和協調能力,這個跟性格有關係,但是,做OPS久了你就會知道,如果你還沒具備一定的溝通和協調能力,那麼趁早撤出這個行業,因爲這個職業不適合你。

我們從OPS的ITIL管理可以看到,幾乎每個流程都是需要溝通和協調的。就拿最基本的變更管理來說,所有的產品上線最後一個關口就是要進入到生產線部署。

那麼,如何協調好研發和測試等資源?做到合理的安排及變更過程中的井然有序?這個完全是OPS的架構師或者說運營工程師來驅動,他會影響變更的成敗。

所以,如果每次變更總是有問題,那麼就要找找自己的問題,這個跟技術能力沒有多大的關係,關鍵在於你是否具備的溝通和協調資源的能力。

  2. 突發故障應急處理能力

具備一定的突發故障的應急處理能力。這個要求比較高,其實,這個能力主要有兩個體現:要有一定的技術能力;要有生產線運營經驗。

技術能力,後天個人不斷學習去獲取;而生產線運營經驗,這些都是血的教訓得來的,這個就是之前我們說的“N”,不過,並不見得“N”越多越好:

而是“N”中,所有的事故或者事件類型的都不重複,或者說相關類型的不能重複,這是最好的。

也就是,我們要從之前教訓中不斷學習和武裝自己,讓自己變得更強大,每當有新的問題發生或者降臨到你的身上,你具備快速的處理事件的一二三理念,很好的運用事故處理的343法則,這是應急處理的能力的關鍵點。

作爲一名優秀的OPS架構師,毫無疑問以客戶爲導向,服務可持續性爲宗旨,要做的事情就是,快速恢復服務,後續排查問題。這個看得簡單,其實在實際運營中,往往被大家疏忽,所以,這點看,你是否具備了。

  3. 不斷反思的能力

具備反思能力,其實這點說的有點嚴重了。不過,我還是不得不嘮叨幾句。在OPS運營過程中,大家往往都會用任務太多了,事情太多了來搪塞自己、以及領導。

從來沒有靜下心來想想,我這段時間做了什麼?有什麼問題?需要有什麼改進?還會有哪些問題會產生?等等這些問題,我們考慮了多少?不得而知。

設身處地的想想,如果你每天處在忙碌的工作中,除了身心疲憊,還會有什麼?除了嘆氣還是嘆氣。如何改變這個局面,從泥潭中拔出來,不是靠別人,而是靠自己,只有自己想明白了,所有的問題都迎刃而解了。

優秀的OPS架構師,需要時刻關注自己所做的一切,要認真對待每一件事情,任何的生產線的架構調整、細節變化需要記錄下來,一天工作下來需要給自己的腦子休息一下,讓腦子想放電影一樣過一下一天所經歷的事情,哪些是痛點問題,哪些是意外,這些都要整理出來。

這樣長年累月,你就會發現你的知識庫就豐富了,應對生產線的能力也輕鬆的不少。如果現在你覺得生產線運營很累,那請歇歇腳,關注一下這方面的問題。

  4. 很強的知新能力

具有很強的知新能力,這是一個優秀的OPS架構師必備條件,也是我爲什麼放到最後一點來講的一個原因。一般情況下具備前面三個條基本具備了架構師的條件了,可以稱得上是一個OPS架構師了。

那麼,知新能力爲什麼這麼重要?因爲這關係到,是止步於“好”,還是變得“優秀”。

打個比方,好的棋盤手能夠看到下一步對方怎麼走,會走其中的兩到三步,而優秀的棋盤手卻能看到五步、十步或者更多,這就是好和優秀的區別。

優秀的架構師,在做好生產線運營的同時,他會花很大的盡力來優化平臺架構,來驅動研發來改進平臺,使之做得更好。

同時,他會結合生產線新運營特點及問題,會提出更適合平臺運營的架構,讓平臺做的更好的擴展性,從而提高了這個OPS的運營效率。

另一方面,知新能力就是要有很強的同行業運營現狀的分析能力,能夠很快將市場上的新技術運用到我們的測試環境中,不斷的儲備自己的知識庫,並驅動整個團隊及相關的兄弟部門。

這一點看是很難,其實要做到並不難,難是難在你所維護的生產線穩定了沒有?溫飽問題解決了沒有?如果還沒解決,那離小康生活還有一段距離呢,那就先解決重點問題,做好架構師前面的三點,麪包自然就會有了。

  小結

好了,說了這麼多,我簡單總結一下,一個合格的運營工程師發展成一名合格的OPS架構師,到最後成爲優秀的OPS架構師,需要經歷風風雨雨,歷盡艱辛萬苦。

或許未來的某一天,當你靜靜的反思,你會發現你已經成功了,因爲,你關注了過程,而不再是結果,所以,你收穫了。

好了,說了這麼多,我簡單總結一下,一個合格的運營工程師發展成一名合格的OPS架構師,到最後成爲優秀的OPS架構師,需要經歷風風雨雨,歷盡艱辛萬苦。

或許未來的某一天,當你靜靜的反思,你會發現你已經成功了,因爲,你關注了過程,而不再是結果,所以,你收穫了。