(點選上方公眾號,可快速關註)
來源:沈萬馬/知乎「知乎老抽 Club」創始人
www.zhihu.com/question/26190832/answer/146259979
【伯樂線上轉註】:本文源自「沈萬馬」對《Cache 和 Buffer 都是快取,主要區別是什麼?》的回答分享,伯樂線上已獲轉載授權。
Buffer常見的是這個:
(來源:train stop buffer bumper)
對,就是鐵道端頭那個巨大的彈簧一類的東西。作用是萬一車沒停住,撞彈簧上減速慢,危險小一些。叫緩衝。
Cache常見的是這個:
(來源:維基百科)
沒錯,就是一種保管箱。看到右邊那個被銹掉的Food Cache沒?這是部署在森林裡的存應急物資的保管箱。功能是把你需要用的東西放在更容易拿到的地方。雖然常用準確翻譯叫快取,但個人以為意思表達的不對,丟了一半的功能。臺灣的翻譯更好,叫快取。
相信看完這些應該不用我說區別了?
哎呀還是賣弄一下吧。
簡單說,Buffer的核心作用是用來緩衝,緩和衝擊。比如你每秒要寫100次硬碟,對系統衝擊很大,浪費了大量時間在忙著處理開始寫和結束寫這兩件事嘛。用個buffer暫存起來,變成每10秒寫一次硬碟,對系統的衝擊就很小,寫入效率高了,日子過得爽了。極大緩和了衝擊。
Cache的核心作用是加快取用的速度。比如你一個很複雜的計算做完了,下次還要用結果,就把結果放手邊一個好拿的地方存著,下次不用再算了。加快了資料取用的速度。
所以,如果你註意關心過儲存系統的話,你會發現硬碟的讀寫緩衝/快取名稱是不一樣的,叫write-buffer和read-cache。很明顯地說出了兩者的區別。
當然很多時候宏觀上說兩者可能是混用的。比如實際上memcached很多人就是拿來讀寫都用的。不少時候Non-SQL資料庫也是。嚴格來說,CPU裡的L2和L3 Cache也都是讀寫兼用——因為你沒法簡單地定義CPU用它們的方法是讀還是寫。硬碟裡也是個典型例子,buffer和cache都在一塊空間上,到底是buffer還是cache?
不過仔細想一下,你說拿cache做buffer用行不行?當然行,只要能控制cache淘汰邏輯就沒有任何問題。那麼拿buffer做cache用呢?貌似在很特殊的情況下,能確定訪問順序的時候,也是可以的。簡單想一下就明白——buffer根據定義,需要隨機儲存嗎?一般是不需要的。但cache一定要。所以大多數時候用cache代替buffer可以,反之就比較侷限。這也是技術上說cache和buffer的關鍵區別。
——————
補充1:不要誤解Buffer就是用來寫的,Cache就是用來讀的。讀可以用Buffer嗎?當然可以,比如你想一批一批地處理讀取而非有啥處理啥的時候,就可以用讀buffer。寫當然也可以用cache,比如你的寫入有很高的隨機性的時候。具體什麼場景用Buffer什麼場景用Cache要根據場景的具體需要決定。
補充2:不要誤解Cache或Buffer就一定是記憶體或者存在什麼高速媒介上的東西。只要相對高速即可。我完全可以在硬碟上存Cache,比如有些遊戲會在執行時建立預編譯的shader(暴露年齡),這本質上就是一種cache,它存在速度緩慢的硬碟上,因為讀硬碟依舊比重新編譯要快。Buffer也同理,例如NTFS檔案系統自己就有Logging Buffer,這個甚至明確拒絕放在任何易失快取裡。
倆英文單詞,不先看看本義嗎?雖然都是抽象單詞,但在各個地方都有具象的應用。
看完本文有收穫?請轉發分享給更多人
關註「資料分析與開發」,提升資料技能