關於 Amazon.com
Amazon.com 是全球最大的線上零售商。2011 年,Amazon.com 從磁帶備份轉為使用 Amazon Simple Storage Service (Amazon S3) 來備份其大部分 Oracle 資料庫。該策略降低了複雜度和資本支出、提供了更快的備份和恢復效能、省去了計劃用於備份和存檔的磁帶容量,並且使管理人員能夠將時間和精力投入到更有價值的工作中。公司能夠使用基於雲的 Amazon S3 儲存來取代備份磁帶基礎設施,無需使用備份軟體,並且能體驗到 12 倍的效能改善,在特定情況下可將恢復時間從大約 15 小時減少到 2.5 小時。
挑戰
隨著 Amazon.com 不斷成長,其 Oracle 資料庫的大小也不斷增長,要維護的資料庫數量也在不斷攀升。由此造成擴充套件難題,即將舊的 Oracle 資料庫備份到磁帶相關的問題,導致他們思考其他可行策略,包括使用 Amazon Web Services (AWS) 的雲服務(Amazon Web Services 是 Amazon.com 的分公司)。Amazon.com 面臨的業務挑戰包括:
-
使用率和容量計劃非常複雜,且時間和資本開支預算經常超支。常年支援磁帶硬體、存放硬體需要的資料中心空間以及磁碟軟體所需的許可費構成了龐大的資本開支。那時,管理磁帶基礎設施需要高技能員工花費大量時間進行設定、認證和工程建檔規劃,而不能從事更高價值的工作。每個財年結束時,預測未來容量還需要進行耗時的審計、預測和預算工作。
-
同時,用以支援多個磁帶裝置的備份軟體所需的花費也悄然到來。磁帶機器人提供了基本的讀/寫容量,但是為了充分利用這些容量,您必須投資購買專門的磁帶備份軟體。對於 Amazon.com,軟體的成本已經很高了,並且大幅提高了總體備份成本。此項軟體成本已然成為持續存在的預算難題,並且,只要仍需將備份寫入磁帶裝置,這一難題就難以解決。
-
使用磁帶維持可靠的備份並快速高效地取回資料,需要耗費大量時間和精力。需要將資料長期儲存在磁帶上時,還需要多個備份。當一切正常工作時,還存在稍微爭用磁帶資源的問題,磁帶機器人和軟體可以輕鬆找到所要的資料。但是,如果發生硬體故障,必須人為幹預才能從磁帶進行恢復。對磁帶的爭用還會導致多個使用者的磁帶請求減緩恢復過程。這會增加恢復時間標的 (RTO),並且與備份到雲儲存相比,達到這一標的更加困難。
為什麼選擇AWS
Amazon.com 開始評估 Amazon S3 在資料備份方面的經濟性和效能改進情況。作為評估的一部分,他們考慮了 Amazon S3 備份的安全性、可用性和效能。Amazon.com 還執行了成本效益分析,確定遷移到 Amazon S3 在經濟方面的合算性。成本效益包含以下元素:
-
效能優勢和成本競爭力。備份的總成本務必不能增加。同時,Amazon.com 還要求更快的備份和恢復效能。與磁帶相比,備份和恢復所需時間和精力均要顯著減少,與從磁帶執行等量恢復相比,從 Amazon S3 執行恢復要快 2 到 12 倍。Amazon.com 要求任何新的備份媒介提供更高的效能,同時維持或減少總體成本。備份到本地磁碟儲存可以提升效能,但是喪失了成本競爭力。Amazon S3 雲儲存在兩個方面都能滿足條件。
-
更好的永續性和可用性。Amazon S3 可在一年內提供 99.999999999% 的資料元耐久性和 99.99% 的資料元可用性。Amazon.com 將這些數字與從磁帶基礎設施觀察所得數字進行比較,確定 Amazon S3 提供了顯著的改進。
-
運營摩擦更少。Amazon.com 資料庫管理員必須評估 Amazon S3 備份對於資料庫備份的可行性。他們確定使用 Amazon S3 進行備份很為容易實施,因為它可與 Oracle RMAN 無縫合作。
-
資料安全性更高。Amazon.com 發現,AWS 能滿足其對物理安全、安全認證評估、保護動態、靜態資料、使用合適的加密標準方面的所有要求。
優勢
隨著完全遷移到 Amazon S3,Amazon.com 認識到這一措施所帶來的好處,包括:
-
消除了複雜、耗時的磁帶容量規劃工作。由於組織變化和併購活動,Amazon.com 越來越壯大,並且逐年增加動態性。AWS 使 Amazon.com 能夠適應這種快速擴張,並且順利地進行過渡。之前,Amazon.com 業務組必須編寫年度備份計劃,計算該年度計劃要使用的磁帶儲存量以及使用這些磁帶資源的頻率。然後,根據這些計劃來向各個組織收取磁帶使用費,從而將成本攤到許多團隊。使用 Amazon S3,團隊只需按使用支付費用,僅計算其所用資源的費用。實際上,對於 Amazon S3 中最多能儲存多少資料沒有上限,也無需擔心資源不足的情況。對於採用 Amazon S3 備份的團隊而言,再也無需進行正式規劃了。
-
減少了資本支出。Amazon.com 再也不需要購買磁帶機器人、磁帶驅動器、備用磁帶、資料中心空間、聯網裝置、企業備份軟體或預測未來的磁帶消耗量。這就早早地消除了針對固定裝置以及資本開支的預算。
-
恢復時可立即獲取資料,無需查詢或取回物理磁帶。無論何時,資料管理員從磁帶恢復資料時,都要面對延遲問題。磁帶備份軟體需要讀取磁帶目錄來查詢要恢復的檔案、找到磁帶並從中讀取資料。在大部分情況下,資料分散在多個磁帶中,而這會導致延遲問題的加劇。這種情況,再加上多個使用者磁帶請求導致的爭用磁帶驅動器的問題,會致使恢復過程會更加緩慢。這種情況在發生重要事件時尤其嚴重,如資料中心執行中斷時,此時需要同時儘快恢復多個資料庫。使用 Amazon S3 這些問題都不存在了。資料恢復可以立即開始,無需等待或磁帶排隊,這意味著資料庫可以更快恢復執行。
-
將資料庫備份到 Amazon S3 比使用磁帶驅動器要快 2 到 12 倍。作為一個示例,在基準測試中,資料庫管理員可以在 2.5 小時內透過 Gigabit 乙太網恢復 3.8 TB 的資料。這相當於每分鐘 25 GB,或每秒 422 MB。另外,由於 Amazon.com 使用 RMAN 資料壓縮功能,有效恢復率達到每秒 3.37 GB。這 2.5 小時的恢復量堪比以保守方式 10 到 15 小時從磁帶恢復的量。
-
輕鬆實現從 Oracle RMAN 備份到 Amazon S3。資料庫管理員發現,將資料庫備份到 Amazon S3 的操作入門非常簡單。將 Oracle RMAN 備份到 Amazon S3 只需配置一個 Oracle Secure Backup Cloud (SBC) 模組即可。配置 Oracle SBC 模組每個資料庫所需的時間不超過 1 小時。完成此一次性設定後,資料庫備份就可以可見的方式重定向到 Amazon S3。
-
Amazon S3 提供持久資料儲存,專為提供高達 99.999999999% 的永續性而設計。Amazon.com 偶爾會遇到磁帶基礎設施硬體故障,如磁帶破碎、磁帶驅動器故障、機器人元件故障。有時候,當資料庫管理員試圖恢復資料庫時出現這種情況,這大大降低平均恢復時間 (MTTR)。有了 Amazon S3 的永續性和可用性,這些問題再也不復存在。
-
解放了珍貴的人力資源。使用磁帶基礎設施,Amazon.com 必須找到在大型磁帶備份安裝方面經驗豐富的工程師,即專業的、熟悉各個供應商不同技術的人員,而這樣的人很難找到。他們還需要僱傭資料中心技術人員來專門從事問題解決和硬體故障排查工作,如更換驅動器、整理磁帶、運輸和跟蹤磁帶等。Amazon S3 讓他們能夠將這些專業人員從日常操作中解脫出來,從事更有價值的關鍵業務工程設計任務。
-
再也不必將物體磁帶運送到場外。所有將 Oracle 備份資料場外儲存的公司應該仔細分析將磁帶運送到場外、安保和場外儲存所需的花費,而這些花費在使用 Amazon S3 儲存資料後就可以減少,甚至可能完全消除。
作為世界上最大的線上零售商,Amazon.com 始終在不斷創新,努力提供更好的客戶體驗並以盡可能地的價格提供產品。其中一個創新舉動就是用 Amazon S3 儲存替代磁帶進行備份操作。此創新是其他將 Oracle 資料庫備份到磁帶的組織可以輕鬆複製的。
下一步
要瞭解有關 AWS 備份和儲存的更多資訊,請訪問:http://aws.amazon.com/backup-storage/。
9月20日,“AWS 技術峰會 2018”將來到深圳,讓我們一同感受 AWS 雲帶來的不同吧!