Google今天(2015年5月6日)美國時間凌晨釋出了雲資料庫Google Cloud BigTable,基於Google幾乎所有最大應用使用已超過十年的王牌技術BigTable(這一點說明瞭Google後續開發的Megastore和Spanner並沒有大幅取代BigTable,而是互補使用的),支援BigQuery和Hadoop(2.4以上版本),但又可以透過業界標準的HBase API(支援1.0)裡訪問。
Cloud BigTable最令人矚目的是其效能,官方部落格用了unmatched(無雙、無與倫比)這樣高調的字眼。它的讀寫延遲都是毫秒級的,與HBase和Cassandra讀延遲好幾百相比的確是秒殺,寫延遲比Cassandra也好一倍以上。
相比之下,BigTable的價格似乎並不太具有優勢。每小時每結點的價格是0.65美元,每叢集最低要3個結點,這樣每個月最低也要0.65 x 3 x 24 x 30 = 1404美元,這還沒算網路和儲存成本。而AWS的DynamoDB每月最低是5美元。當然,客觀說,DynamoDB直接的對應的是Google的另一項雲服務DataStore(起始使用免費)。
Google Cloud BigTable野心不小,它明確說針對的應用場景包括金融(交易歷史、股價、匯率)、廣告營銷(購買歷史和使用者行為)、能源/物聯網(電錶和家電資料)、生物醫葯和電信等行業的大資料分析,包括時間序列資料。標桿案例也是金融軟體巨頭SunGuard的一個審計原型系統,每秒能處理250萬條交易資訊。
其他案例還包括:
-
Pythian將時間序列資料庫OpenTSDB與Cloud Bigtable整合,開發了一個監控平臺;
-
開源空間數控GeoMesa的貢獻者CCRi透過與Cloud Bigtable整合,提供了實時空間分析平臺;
-
IoT方案商Telit Wireless Solutions藉助Cloud Bigtable大大提升了資料處理能力;
-
Qubit(也是由前Google員工創辦的公司)已經將數P資料遷移到Cloud BigTable上。
根據檔案,它的適合場景是:
單索引的、稀疏表,可以擴充套件到數億行、數千列,儲存T級甚至P級資料量。低於1TB就不要考慮了。
非常適合儲存低延遲的海量單鍵資料。
是MapReduce運算的理想資料源。
Cloud Bigtable不是關係資料庫,也不支援SQL查詢、連線和多行事務。與Google雲服務上其他儲存方案的選型檔案說得很清楚,翻譯如下:
-
如果需要OLTP系統的完整SQL支援,考慮Google Cloud SQL。
-
如果需要OLAP系統的互動查詢,考慮Google BigQuery。
-
如果需要儲存大於10MB的不變blob,例如大的圖片和影片,考慮Google Cloud Storage。
-
如果需要儲存高度結構化物件,或者要支援ACID事務和類SQL查詢,考慮Cloud Datastore。
參考連結
Google Cloud BigTable的檔案:https://cloud.google.com/bigtable/docs/
Google官方已經在StackOverflow上開了標簽:http://stackoverflow.com/tags/google-cloud-bigtable/
Hacker News上的討論:https://news.ycombinator.com/item?id=9497060
官方開源客戶端:https://github.com/GoogleCloudPlatform/cloud-bigtable-client
出處:極客頭條-劉江總編
連結:http://geek.csdn.net/news/detail/32144