然而,構建企業私有雲並非是一蹴而就的,正如Gartner的副總裁Tom Bittman所述“部署私有雲並不是簡單地對硬體進行採購,而是一場革新”。
對於企業私有雲而言,具有應用系統複雜、標準化程度低、定製化程度高、系統體量大、安全要求高等特點,需要高瞻遠矚統籌規劃,才能建設一個科學可持續發展的私有雲。當然,私有雲的建設同樣應遵循資訊系統建設的通用方法,即事前分析規劃、事中落地實現以及事後運維管理。
下麵,我將從企業私有雲建設的需求分析、企業私有雲建設的要點以及企業私有雲的運維與管理等三個方面對大型企業私有雲的建設進行分析和總結。
作者:孫傑
來源:華章計算機(ID:hzbook_jsj)
01 企業私有雲建設需求分析
在建設企業私有雲之前,首先需要回答和解決的問題是:企業是否真的需要私有雲?需要什麼樣的私有雲?企業私有雲的建設是一個長期的系統工程,初始成本的投入也較為高昂。因此,企業在建設私有雲之前,應從以下幾方面對需求和現狀進行評估。
1. 需求和資源使用特點
大多數企業的IT系統現狀:
系統利用率低:煙囪式的系統建設部署方式,導致系統資源無法共享,系統負載不均衡,整體資源利用率和能耗效率低。
建設擴容成本高:IT系統中原有的UNIX伺服器、資料庫和儲存陣列佔比較高,標準化程度低,通用性差,導致建設擴容成本難以控制,給系統統一維護帶來困難。
擴充套件能力有限:系統的Scale-Up能力和Scale-out能力不足,難以應對越來越大的系統處理和儲存壓力。
那麼針對以上的現狀,如何去透過雲端計算來改變呢?首先我們需要的是:
-
動態部署架構:構建基於標準化硬體裝置和虛擬化架構之上的雲端計算基礎設施資源池,可對上層應用按需提供彈性資源,實現多系統有效共享,有效提高IT系統資源利用率和能耗效率。
-
標準硬體單元:雲端計算採用標準的運算和儲存處理單元,有效降低系統建設和擴容成本。
-
高可擴充套件性:雲端計算硬體叢集技術和軟體並行處理能力能夠提供出色的Scale-out能力,幾乎無限擴充套件IT系統的處理和儲存能力。
2. 資訊系統的標準化程度
在雲端計算環境中,資訊系統所具有的標準化程度往往是決定私有雲形態的重要因素。
對資訊系統的標準化評估存在多個維度,包括基礎架構環境標準化 (例如所需支撐的硬體是專用硬體還是通用硬體)、平臺環境標準化(例如對於開發環境、中介軟體環境以及資料庫環境的通用需求和租戶限制)、以及應用系統的標準化(例如應用系統的執行環境、封閉系統亦或是開發系統、商用套裝軟體或是自開發系統、是否支援分散式等)。
不同維度的標準化實現決定了企業私有雲應該建設為IaaS雲、PaaS雲亦或是SaaS雲。
3. 雲化建設/遷移的難度
將新的應用系統直接部署在雲端計算環境中,或將原有系統遷移到雲端計算環境中,是兩種主要資訊系統的雲化改造路徑,對其實現難度的評估是對應用系統進行雲化改造風險與收益評估的重要手段。
整個業務系統的雲化分析過程需要從包括硬體支撐環境改造、作業系統平臺變更、平臺軟體系結分析、IP地址依賴性消除、 API重構、模組化改造、標準化改造、外部依賴條件等在內的多個層面和維度進行,準確評估業務資訊系統雲化改造的相關難點與痛點,才能對資訊系統雲化改造有充分的認識和準備。
4. 關於成本的評估與考慮
企業建設私有雲往往會考慮定製化和一些業務特定的需求,其標準化程度往往低於公有雲,由此所帶來的自動化、運維、管理開銷會更高;最後,培養雲端計算人才在傳統企業環境要求則更高,工作技能、職能的轉變同樣需要成本的投入。
02 企業私有雲建設要點分析
構建私有雲,始於企業對自身資訊系統建設需求的解析與明確。企業選擇私有雲的初衷,大多基於自身資訊化建設的考慮,主要驅動力包括降低軟硬體成本、實現應用系統快速部署、彈性擴容應對業務負載突發性增長需求、構建安全可靠自主可控的基礎架構環境等。
而私有雲對以上需求的支援並非是天然的,在架構設計需要明確設計要點和建設思路,一般說來,在設計企業私有雲過程中需要對以下重點關註。
1. 資源池
雲端計算要進行軟硬體資源的統一管控和靈活排程,首先需要做到的就是對資源的納管,即構建資源池。需要註意的是,資源池的意義並非僅僅是透過平臺使軟硬體資源的可知可控成為可能,更為重要的是:明確與之相匹配的管控手段和策略,使其涵蓋資源的全生命週期管理。資源池建設重點可以歸納為資源可達、規模可控與能力可知:
1.1 資源可達
資源池是在技術層面打破舊有的豎井式資訊系統建設樣式的關鍵,是軟硬體資源實現統一管控、靈活排程的基礎。
在資源池中,需要利用伺服器虛擬化、儲存虛擬化和網路虛擬化技術,使任意資源在技術上都可以透過網路(IP網路或儲存網路)以服務的形式被無障礙、無區別的供給,應用可以以多種方式訪問和使 用既定規則允許範圍內的任意資源。
因此,在資源池設計中,對各型別資源的打通和連線是其實現重點。
1.2 規模可控
我們在談及雲端計算時,往往會說雲端計算提供了幾乎無限的可能性,這主要是在指雲端計算的彈性。雲端計算由於在架構設計上避免了底層硬體資源孤島,對資源的共享訪問方式將放大資源池的彈性效果。
規模可控的實現最為重要的是制定資源池擴充套件和收縮的規則,透過使用時間、使用量、持續時間、優先順序等一系列量化閾值觸發規則在資源池體量不足時可以靈活的向資源池中新增各種資源,在資源池空閑時,也可以釋放部分資源給其他資源池使用。
1.3 能力可知
在資源池投入使用後,應實時/準實時的對資源池的承載能力進行分析。以監控資料為基礎,透過具備科學完備的統計方法和計算規則,評估可供給的服務能力,對應用需求的滿足度進行分析。
要實現資源池的能力可知,必須具備完善的資源監控手段、實時/準實時更新CMDB,採用合理的感知方式並制定合理的 資源能力計算規則,同時,由於應用需求各不相同,要準確評估對應用的滿足度,還需要梳理出典型業務模型,據此評估不同應用模型對資源的需求與消耗。
2. 雲管理平臺
雲服務設計、釋出和管理是雲端計算的核心,體現了雲端計算的運營形態,而雲管理平臺是實現雲服務全生命週期管理的基礎,是實現雲端計算運營樣式的載體。
按照ISO/IEC最新釋出的雲端計算參考架構,其中功能層中的使用者功能層、訪問功能層和服務功能層都應該在雲管理平臺中進行實現.對於雲管理平臺而言,其建設重點可以歸納為狀態可視、分配可控和服務可用:
2.1 狀態可視
對於雲平臺而言,可視並不僅僅代表圖形化的訪問和管控,企業建設私有雲更為重要的是從雲服務供應商的視角透過雲管理平臺實現對資源的集中管控。
因此在雲端計算環境中,監控的重要性將上升到前所未有的高度,同時,相比於傳統資訊系統架構,監控的含義和涵蓋的範圍也有了很大的變化,一般說來,在企業私有雲平臺中,必須具備對包括基礎架構資源、服務、安全審計在內的監控能力:
①對包括物理和虛擬化計算資源、儲存資源、網路資源等基礎架構資源的資產管理、使用情況和裝置狀態的監控,並及時發現、處理和上報問題。
②面向服務的監控主要集中在兩個方面:一方面監控上線服務的執行狀態,確保其運轉正常,及時發現事件與問題;另一方面是對SLA服務等級的達成度監控。
③安全和審計的監控包括:根據在雲端計算環境中依照業務需求制定的安全規範,面向使用者訪問、租戶資料/資源隔離、日誌採集和分析等進行安全和合規性檢查和監控。做到風險可識別、問題可發現、訪問可控制、操作可追溯,達成SLA對安全的要求與約定。
2.2 分配可控
基礎架構資源的管控是雲端計算運營最重要的基礎和最核心的資源。對基礎架構資源的合理管控是企業建設自己的私有雲的重要出發點,而對資源管控的實現需要透過雲管理平臺完成。
對於雲端計算環境中的基礎架構資源,從初始建設、分配使用在到回收等一系列動作都應該根據服務設計和相關SLA規定製定詳細、規範的流程以及科學合理的處理手段,使雲管理平臺對資源的管控涵蓋資源的全生命週期,做到初始建設合理、管控過程合規、資源分配合適、管控操作可回溯、已分配資源可回收。
2.3 服務可用
服務是雲端計算環境的核心。在構建私有雲時企業往往會從自身的應用特點和需求出發進行服務的設計和實現,因此很難針對私有雲制定通用的服務模板,依據雲端計算建設的通用方法,對於雲服務的建設,一般說來會關註以下四個方面:
①雲服務的識別:雲服務的識別是雲服務實現的第一步,決定了在雲端計算環境中將供給的服務內容。雲服務的識別是以需求調研為基礎的,從必要性、可復用性、實現成本等多個角度出發,分析服務實現的難點和收益,制定服務分階段實現的計劃與路線圖。
②雲服務的設計:在雲端計算環境中對雲服務的使用樣式決定了雲服務的設計要點,一般說來,對於雲服務的設計內容包括服務的底層架構、服務的執行流程、服務安全與監控、服務的審計與合規性檢查、評價服務能力的關鍵指標(KPI)、服務的高可用、服務的SLA等幾個方面。
③雲服務的實現:雲服務的實現一般說來有四種方式:一是從業務需求分析出發進行雲服務的定製開發;二是利用第三方軟硬體產品進行服務封裝;三是從其他雲端計算運營商購買,合作實現;四是基於已有服務進行服務組合,形成新的服務。
④雲服務的維護:在雲服務上線後,對雲服務的運維是企業私有雲成敗的關鍵。對於雲服務的維護包括兩個方面。一是針對雲服務自身的維護,包括對服務能力和狀態的監控、對服務效能和規模的趨勢分析、服務的修正與升級、服務底層架構的維護等;二是服務的SLA達成度保障,包括實時監控服務的KPI並與 SLA所規定的服務標的進行比較,在不符合SLA時及時幹預使其符合要求,同時,確保滿足SLA所規定的安全、隔離等相關條款。
3. 自動化與標準化
在雲端計算環境中,自動化物件往往是哪些經常使用、手工發起的複雜操作,這就要求自動化的物件應符合通用設計,遵循相同的技術規範,具備一致的處理流程,動作行為可引數化,即自動化的標的應該是標準化的。
標準化實現的層次決定了可以實現自動化操作的物件,而這往往決定了雲端計算的建設樣式。
例如,當基礎架構資源在資源分配方式、資源分配粒度、資源分配方法等符合標準化時,可以考慮構建基於基礎架構資源的IaaS雲,在包括開發環境、資料庫、中介軟體在內的平臺軟體在符合標準架構和流程、具備標準化執行環境等條件時,可以考慮構建基於平臺的PaaS雲,而在應用部署樣式相類、服務樣式統一、支援分散式、基於SOA架構等的應用系統等,可以考慮構建基於軟體SaaS雲。
需要註意的是,並非所有的基礎架構、平臺軟體和應用軟體都具備標準化的條件,而標準化的代價同樣高昂,包括硬體重構、SOA改造等標準化過程需要投入大量的資金和人力成本,一般說來,封閉的系統環境和商用套裝軟體的標準化改造難度較大。
在自動化過程中,特別需要考慮的另外一點是:自動化在帶來便捷、高效的同時,不合理的自動化流程設計將可能會導致錯誤的蔓延和環境的失控。因此,在進行自動化設計過程中,尤其需要註意規則的設定和異常處理。
4. 雲安全
企業不使用公有雲而選擇自建私有雲最大的考慮就在於安全。資料表明,安全已經成為阻礙雲端計算發展的最主要原因之一。根據CDA資料分析師協會統計,32%已經使用雲端計算的組織和45%尚未使用雲端計算的組織將雲安全作為進一步部署雲的最大障礙。
在雲端計算體系中,安全涉及到很多層面,一般說來,在雲端計算環境中應主要考慮網路安全、儲存安全、物理機安全、虛擬化安全、虛擬化管理安全、交付層安全、資料安全、安全服務和運維安全等9個層面和領域。
同樣需要註意的是,並非所有的應用安全問題都應該依賴雲端計算環境的安全架構來解決。雲端計算基礎架構環境支援的系統種類眾多、業務要求和安全基線各有不同,在對使用者進行服務供給時應根據服務種類以及SLA對安全服務內容進行嚴格的規範,劃分清晰的分工和責任介面。
03 企業私有雲建設的思考總結
企業私有雲的建設並非只是新技術的變革與引入,而是顛覆傳統資訊系統建設樣式的系統工程。結合企業的特定需求,企業私有雲的建設思路大可不盡相同,建設方法也不會千篇一律。
是選擇商用雲平臺還是選擇開源雲平臺來建立企業的私有雲,這需要企業綜合考慮,權衡利弊,依據企業自身技術能力,資金投入總量,實現業務效果等各個方面去考慮雲平臺技術選型。所以沒有好與不好,只是能否適用和用的好。
建設企業私有雲不是一蹴而就的,而且這將是持續不斷的投入過程,需要在實踐中不斷摸索前進。
關於作者:孫傑,資深雲端計算技術專家、架構師和運維專家,雲端計算開源產業聯盟OSCAR社群核心專家成員。在系統、運維、雲端計算和資料中心管理等領域有10餘年工作經驗,先後在外企、網際網路、電商、大型企業任職,在若干大中型專案的建設、部署和運維中,積累了豐富的架構設計和專案實施經驗。
本文摘編自《企業私有雲建設指南》,經出版方授權釋出。
延伸閱讀《企業私有雲建設指南》
長按二維碼瞭解及購買
推薦語:資深雲端計算專家、架構師和運維技術專家撰寫,9位行業領袖和技術專家聯袂推薦。