筆者在之前文章“2017全球超級計算Top500和Green500榜單分析”中對高效能運算TOP500排行榜進行了分析,看到中國的太湖之光、天河2號繼續保持第一、第二,中國超算在該基準測試中已經連續多年衛冕奪冠了,但是讓我講講接下來聊聊你可能並不知道的事。
TOP500排名基於Linpack BenchMark效能(最新版HPL 2.0規範從2008年一直用到現在),不過隨著時間的推移,應用程式對更複雜計算的需求已變得原來越普遍,TOP500創始人之一的田納西大學教授Jack Dongarra認為Linpack效能已經過時,大家也意識到單看CPU效能的弊端,開始使用HPCG(The High Performance Conjugate Gradients)效能來全面衡量超算效能。
天河2號之前也是HPCG(高度共軛梯度基準測試)效能第一名(2016年上半年度的HPCG效能榜單,中國的天河2號是第一,日本K位列第二),但從2016年下半年開始,第一被日本K超算系統奪走,當時K超算系統在TOP500中的排名目前是第七。
與Linpack關註線性方程的計算效能不同,HPCG使用更複雜的微分方程計算方式。Linpack衡量的是線性方程計算的速度和效率,無法測量這些更加複雜的計算程式。由於越來越多的應用程式採用微分方程計算方式,所以每一輪全球超級計算機500強排行榜的Linpack效能資料與真實的資料之間的差距將越來越大。
簡單來說,Linpack更考驗超算的處理器理論效能,而HPCG更看重實際效能,對記憶體系統、網路延遲要求也更高,所以任何HPC超算測出來的HPCG效能要比Linpack效能低得多,基本報中告有個HPCG/HPL比率可衡量計算效率,大部分超算的比例都在5%以內,1-3%的比比皆是。
HPCG標準從2014年開始正式參與排名,2017上半年的HPCG效能排行榜中,國內的天河2號以580TLFOPS位列第二,日本K(京)以602TFLOPS位列第一, TOP500第一的太湖之光HPCG效能是480TFLOPS,位列第三。太湖之光的HPCG/HPL效率只有0.4%是HPCG前10名中效率最低的。
關於HPC系統能力基準排名,除了TOP500、Green500和HPCG之外,還有一個Graph500排名和Green Graph 500排名,Green Graph 500使用與Green500相同的效能指標,但它是根據每瓦特效能排名,即採用Green 500測試模型測試但配合Top500(HPL)使用每瓦特效能排序。
從2017年上半年的Graph500榜單來看,日本K超算也拿下了第一名,第二名是中國太湖之光,天河2號已經處於第八名的位置。
Graph500專註於資料密集型負載BenchMark基準,標的是提高對複雜資料問題的認識,而不是專註於Top500所依賴的HPL(High Performance Linpack)等計算基準。在2010年的國際超級計算大會上第一次釋出測試基準值。新版本的串列每年發行兩次,用於對超級計算機進行排名的主要效能指標是GTEPS( Giga-Traversed Edges per Pecond千兆每秒邊緣遍歷)。
Graph500使用的基準測試強調系統的通訊子系統,而不是計算雙精度浮點數,它是基於大無向圖中的廣度優先搜尋(平均程度為16的Kronecker圖)。基準測試中有兩個計算核心,第一個內核是生成圖形並將其壓縮為稀疏結構CSR或CSC(Compressed Sparse Row/Column); 第二個核心對一些隨機頂點進行並行BFS搜尋(每次執行64次搜尋迭代)。
2017年超算首次釋出了IO-500測試基準,綜合反映I/O系統效能,IO-500測試分為兩個大部分,一個部分是頻寬測試,採用IOR程式進行測試;另一部分是元資料測試,採用mdtest程式和find命令進行測試。
第一名是部署在JCAHPC的IME系統。IME系統由DDN公司開發的Burst Buffer系統,其IO-500測試得分比第二名高出了43%,說明瞭IME還是有很強的競爭優勢的。
第二名是部署在KAUST的DataWarp,DataWarp是由Cray公司開發的基於快閃記憶體的Burst Buffer系統。Burst Buffer就是為這種浪湧型IO特徵設計。
單從檔案系統來看,排名中Lustre檔案系統有3個,BeeGFS有2個,Spectrum Scale (GPFS)有2個。這3種並行檔案系統基本佔領榜單,關於BeGFS請參看文章繼Lustre和GPFS之後,HPC又迎來那個新檔案系統接盤。
最後討論一下HPC場景我們經常用到的測試基準。這些基準應用於不同HPC場景,主要從應用基準和微觀基準來進行描述。應用基準是偏向於某種應用的BenchMark,測試更具有針對性;然而微觀基準則更具普適性,更加偏向於純粹的工具效能測試。
上圖展現的是常見的應用基準測試實體,除了HPCG外,主要包括GTC-P 、Meraculous、MILC、MiniDFT 、MiniPIC和PENNANT等。
GTC-P(Gyrokinetic Toroidal Code)透過使用粒子單元演演算法求解Vlassov-Poisson方程來模擬離子透過託卡馬克的運動。在每個PIC(particle-in-cell)時間步長期間,粒子的電荷分佈被內插到網格上,泊松方程在網格上求解,電場從網格內插到粒子,並且根據電場更新粒子的相空間坐標。
Meraculous是一種大規模並行基因組組裝基準,構造並遍歷存在於冗餘短序列輸入資料集中的長度為k(k-mers)的所有重疊子串的de Bruijn圖。透過遍歷de Bruijn圖,併發現所有(可能斷開的)線性子圖,Meraculous能夠構建基因組資料的高質量連續序列。