大資料分析和人工智慧領域近年來的研究進展,為企業收集有關其業務每一個可衡量方面的資訊創造了強大的動機,這應該不足為奇。而且,現在的金融監管條例要求各單位保留相關記錄的時間也比過去要長得多。所以,各類公司和機構儲存的資訊都越來越多。
研究顯示,被記錄下來的資料在容量上正在以每年30%到40%的速度增長[1]。與此同時,用於儲存資料的現代硬碟的容量增長速度還不到這一速度的一半。幸運的是,大部分資訊並不需要即時訪問。對於這類資訊,磁帶是完美的解決方案。
真的嗎?磁帶?這個想法可能會喚起對出現在像《電腦風雲》(Desk Set)或《奇愛博士》(Dr. Strangelove)這樣的老電影裡的那種在大型主機旁斷斷續續地轉動的盤式磁帶的回憶。那麼,讓我們來做個快速的事實核查吧:磁帶從未消失!
的確,世界上大部分資料仍然保留在磁帶上,包括基礎科學(如粒子物理學和射電天文學)、文化遺產和國家檔案、電影、銀行、保險、石油勘探及其他很多方面的資料等。甚至還有一群人(包括我在內,接受過材料科學、工程或物理學方面的專業訓練),他們的工作就是不斷改進磁帶儲存。
是的,磁帶已存在很長時間了,但該技術尚未成為歷史,而是恰恰相反。像硬碟和電晶體一樣,磁帶在過去幾十年中取得了巨大進步。
第一個商用數字磁帶儲存系統是IBM推出的Model 726,它可以在一捲磁帶上儲存大約1.1兆位元組資料。今天,一盒時新的磁帶可容納15TB資料。一個機械磁帶庫可容納多達278PB的資料,如果是將這麼多資料儲存在光碟上,那麼將需要3.97多億張光碟(能將它們一張壓一張地疊放起來的話,會形成一座高度超過476千米的高塔)。
確實,磁帶不能提供如硬碟或半導體儲存器那樣快速的訪問速度。不過,磁帶的優勢還是很多。首先,磁帶儲存更節能:一旦所有資料被記錄了下來,磁帶盒就會安靜地獃在機械磁帶庫的插槽中,根本不消耗任何電量。磁帶也非常可靠,錯誤率比硬碟低四到五個數量級。磁帶還是非常安全的,具有內建的、動態加密以及由介質本身的性質所提供的額外安全性。畢竟,如果磁帶沒有安裝在驅動器中,則無法訪問或修改其上儲存的資料。鑒於透過網路攻擊導致的資料竊取在不斷增長,這種“air gap”網閘尤其具有吸引力。
磁帶的離線特性還為有缺陷的軟體提供了額外的防線。例如,在2011年,Google的一次軟體更新中,程式碼裡的一個缺陷導致Google意外刪除了大約40,000個Gmail帳戶的電子郵件。儘管在多個資料中心的硬碟上儲存了多個資料副本,但資料仍有所丟失。幸運的是,資料也記錄在了磁帶上,Google最終從磁帶備份中恢復了所有丟失的資料。
2011年的Gmail事件是最早披露的雲服務提供商使用磁帶進行運營的案例之一。更近一些時候,微軟宣佈其Azure Archive Storage使用了IBM的磁帶儲存裝置。
1951年:最早被用在計算機(Univac)上記錄資料的磁帶。照片來源:Bettmann / Getty Images
1952年:推出商用計算機磁帶儲存系統(IBM 726)。照片來源:IBM。
1964年:推出九軌磁帶。照片來源:IBM。
1968年:推出自動穿帶磁帶機(IBM 2420)。照片來源:IBM。
1974年:最早的自動(機械)磁帶庫(IBM 3850)。照片來源:IBM。
1974年:最早的自動(機械)磁帶庫(IBM 3850)。照片來源:IBM。
1984年:推出薄膜磁頭技術(IBM 3480)和4×5英寸磁帶。照片來源:IBM。
1989年:推出數字化資料儲存磁帶(螺旋掃描磁帶)。照片來源:Kadin2048 /Wikipedia。
1993年:推出數字線性磁帶。照片來源:Christian Taube /Wikipedia。
2009年:IBM推出線性磁帶檔案系統。照片來源:IBM。
2009年: IBM推出線性磁帶檔案系統。圖片來源:Hewlett Packard Enterprise / IBM / Quantum。
2017年:最新一代LTO(LTO-8)釋出。照片來源:IBM。
儘管磁帶有以上優點,公司使用磁帶的主要原因通常還是出於經濟上的考慮。磁帶儲存的成本是將相同數量的資料儲存在磁碟上所需成本的六分之一,這就是為什麼你幾乎可以在任何儲存大量資料的地方找到磁帶系統的原因。但由於磁帶現在已經完全從消費級產品中消失了,大多數人都不知道它的存在,也就更不知道磁帶記錄技術在近年來所取得的巨大進步以及在可預見的將來會繼續取得的進步了。
所有這一切都是在說,磁帶已經陪伴我們幾十年,並會在未來幾十年繼續存在。我怎麼能這麼肯定?繼續讀下去,你就知道原因了。
磁帶之所以能存活這麼久,有一個根本原因:它很便宜。而且,它正在變得越來越便宜。但情況會一直如此嗎?
你可能會認為,如果將更多資料塞進硬碟的能力正在減弱,那麼對於使用相同的基本技術但更老的磁帶來說也會是如此。令人驚訝的現實是,對於磁帶而言,這種容量的擴大並沒有顯示出放緩的跡象。事實上,其儲存容量應該能以每年約33%的歷史增長速度繼續增長多年,這意味著大約每兩到三年磁帶的儲存容量就會翻一番。這可以看作是磁帶的摩爾定律。
對於那些不得不在儲存預算不高的情況下應對資料爆炸式增長問題的人來說,這是個好訊息。要理解為什麼磁帶仍然具有比硬碟大的潛力,可以思考下磁帶和硬碟的進化方式。
兩者依賴於相同的基本物理機制來儲存數字化的資料。它們以磁性材料薄膜中的窄軌道來實現儲存,在薄膜中磁性在兩種極性狀態之間切換。資訊被編碼為一系列位元,由沿軌道分佈的特定點處存在或不存在磁極轉換來表示。自20世紀50年代推出磁帶和硬碟以來,兩者的製造商一直被“更密集、更快、更便宜”的口號所驅策。發展結果是兩者的成本(以每千兆位元組容量所需美元計)都已經降低了多個數量級。
磁性基板每平方毫米上可記錄資訊的密度指數式增長,這導致了硬碟和磁帶成本的降低。面密度(areal density)是沿資料軌道的記錄密度和垂直方向上的軌道密度的乘積。
在早期階段,磁帶和硬碟的面密度相似。但是,更大的市場規模和來自硬碟銷售的收入為更大規模的研發工作提供了資金,這使得硬碟的製造商能夠更積極地提高硬碟的面密度。結果是,高容量硬碟目前的面密度大約是最新的磁帶的100倍。
儘管如此,由於磁帶具有更大的可用於記錄的錶面積,最先進的磁帶系統裡的一盒本機磁帶可容納高達15TB的資料——超過了市場上容量最大的硬碟的容量。儘管兩種裝置佔用的空間差不多,但事實的確如此。
照片來源:Victor Prado
內部和外部:一種時新的使用線性磁帶開放技術(LTO)的盒式磁帶,它只包含一個卷軸,將它插入磁帶系統後,磁帶會自動捲到傳動裝置內建的卷軸上。
當然,除容量外,磁帶和硬碟的效能特徵是非常不同的。盒式磁帶中帶子的長度通常為數百米,導致平均資料訪問時間為50到60秒,而硬碟的平均資料訪問時間僅為5到10毫秒。但是,令人驚訝的是,將資料寫入磁帶的速率是寫入磁碟速度的兩倍多。
在過去幾年中,硬碟上資料的面密度增速已從其歷史平均值的每年約40%放緩到10%至15%之間。原因與一些基本物理事實有關:要在給定面積中記錄更多資料,就需要為每個位元分配一個更小的區域。這反過來會減弱讀取這個位元時可以得到的訊號的強度。如果訊號在強度上降低過多,它就會消失在硬碟上塗有的磁性顆粒因其顆粒特性而產生的噪音之中。
透過使這些顆粒變小,可以減少背景噪音。但是很難將磁性顆粒縮小到一定的尺寸而不會損害它們以穩定的方式保持磁性狀態的能力。在這個行業中,用於磁記錄的最小可行尺寸被稱為超順磁極限。而硬碟製造商已經抵達了這個極限尺寸。
直到最近,這種容量增速的放緩對消費者來說都並不明顯,因為硬碟製造商能夠透過在每個硬碟中新增更多的磁頭和碟片來進行補償,從而在相同尺寸的包裝中實現更高的儲存容量。但現在,可用的空間和增加更多磁頭和碟片的成本都限制了硬碟製造商所能獲得的收益。增速放緩開始變得明顯。
一些正在研發的技術可以使硬碟突破現今的超順磁極限的限制。這些技術包括熱輔助磁記錄技術(HAMR)和微波輔助磁記錄技術(MAMR),它們允許使用更小的顆粒,從而使磁碟的更小區域被磁化成為可能。但這些方法增加了成本並帶來了棘手的工程挑戰。根據製造商的說法,即使這些技術研發成功了,它們能提供的容量增長可能也是有限的。例如,最近宣佈將在2019年開始出貨MAMR硬碟的西部資料公司預計說,MAMR技術只能使硬碟的面密度每年增加約15%。
相比之下,磁帶儲存裝置目前使用的面密度還遠在超順磁極限之下。因此,磁帶的摩爾定律還可以持續十年或更長時間,而不會遇到這些基礎物理層面的障礙。
然而,磁帶也是一種棘手的技術。它的可拆卸性、使用薄的聚合物基板而不是剛性基片以及同時在多達32個平行軌道上記錄,為設計人員帶來了很大障礙。這就是我在IBM蘇黎世研究實驗室的研究團隊一直努力尋找能使磁帶容量持續擴充套件的方法(要麼適應性採用磁碟技術,要麼發明全新的方法)的原因。
2015年,我們和富士膠片株式會社的合作伙伴一起展示了透過使用垂直於磁帶的超小鋇鐵氧體顆粒,可以使磁帶的資料記錄密度達到目前的商用技術可實現的密度的12倍以上。最近,我們與索尼儲存介質解決方案公司合作展示了以大約20倍於目前最先進磁帶的面密度來記錄資料是可能的。如果能將這項技術商業化,那麼現在可能需要一打盒式磁帶來存檔其所有數字材料的一部大製作電視節目,將來只用一盒磁帶就能存得下來。
照片來源:David Parker/Science Source; 版權所有: IBM。
資料洪流:現代磁帶庫可容納數百PB,而1952年推出的IBM 726(下圖)僅能儲存幾兆位元組。
我們在技術上取得了很多進步,才實現了這樣規模的儲存容量。首先,我們提高了讀寫磁頭沿著磁帶上的細長磁軌移動的能力。在我們最新的演示中,磁軌寬度只有100奈米左右。
我們還不得不減小資料讀取器——用於讀取記錄資料的磁軌的磁阻感測器——的寬度,使從其當前的微米尺寸縮小到了小於50奈米的程度。結果是,我們用這麼小的讀取器獲取到的訊號非常嘈雜。我們透過提高介質本身的信噪比(它是磁性顆粒的尺寸和方向以及它們的成分、磁帶錶面的平滑度和光滑度的函式)來補償。為了進一步解決這個問題,我們改進了裝置所採用的訊號處理和糾錯方案。
為了確保我們的新原型介質能夠將資料儲存數十年,我們改變了記錄層中的磁性顆粒的性質以使其更加穩定。但是,這一改變使得記錄資料變得更加困難,以至於普通的磁帶感測器無法可靠地將資料寫入新介質。為此,我們使用了一種能產生比傳統磁頭強得多的磁場的特殊寫磁頭。
結合使用這些技術,我們能夠在我們的實驗室系統中以每英寸818,000位元的線性密度讀寫資料(由於歷史原因,世界各地的磁帶工程師以英寸為單位衡量資料密度)。結合使用新技術可以處理的每英寸246,200個磁軌,我們的原型裝置達到了每平方英寸201千兆位元的面密度。假設一個磁帶盒可以容納1,140米長的磁帶(鑒於我們所使用的新磁帶介質厚度小於以前的,這是一個合理的假設),這一面密度對應於高達330 TB的單盒磁帶容量。這意味著一盒磁帶可以記錄的資料與裝滿一輛手推車的硬碟所能容納的一樣多。
在2015年,資訊儲存產業聯盟(一個由惠普、IBM、甲骨文、昆騰及若干學術研究團體共同成立的組織)釋出了《國際磁帶儲存路線圖》(International Magnetic Tape Storage),文中預測說,到2025年,磁帶儲存的面密度將達到每平方英寸91 Gb。根據這一趨勢推斷,到2028年,磁帶儲存的面密度將超過每平方英寸200 Gb。
該路線圖的作者們都對磁帶儲存的未來感興趣。但你不必擔心他們過於樂觀。我和我的同事們最近進行的實驗室實驗表明,每平方英寸200 Gb的面密度完全有可能實現。因此,在我看來,在未來至少十年內,磁帶完全有把握保持過去的容量增速。
實際上,磁帶可能屬於最後一批仍然遵循摩爾定律的資訊科技——至少在未來十年內,它仍能遵循這一定律。而這反過來只會增加磁帶相對於硬碟和其他儲存技術的成本優勢。因此,即使你可能很少在黑白電影之外看到它,磁帶在未來數年裡依然會發揮重要作用。
- 本文刊登在2018年9月期印刷版的IEEE SPECTRUM上,標題為“Tape Storage Mounts a Comeback”
- 本文轉自“IEEE電氣電子工程師學會”。
-
本文作者Mark Lantz是IBM蘇黎世研究實驗室的先進磁帶技術經理。
參考文獻:
John Gantz, David Reinsel. The Digital Unviserse in 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East – United States. Februry 2013. Available at
https://www.emc.com/collateral/analyst-reports/idc-digital-universe-united-states.pdf