-
2010 年 Netflix 內部開發了 AWS 雲上隨機終止 EC2 實體的混沌實驗工具:Chaos Monkey
-
2011 年 Netflix 釋出了其猴子軍團工具集:Simian Army
-
2012 年 Netflix 向社群開源由 Java 構建 Simian Army,其中包括 Chaos Monkey V1 版本
-
2014 年 Netflix 開始正式公開招聘 Chaos Engineer
-
2014 年 Netflix 提出了故障註入測試(FIT),利用微服務架構的特性,控制混沌實驗的爆炸半徑
-
2015 年 Netflix 釋出 Chaos Kong ,模擬 AWS 區域(Region)中斷的場景
-
2015 年 Netflix 和社群正式提出混沌工程的指導思想 —— Principles of Chaos Engineering
-
2016 年 Kolton Andrus(前 Netflix 和 Amazon Chaos Engineer )創立了 Gremlin ,正式將混沌實驗工具商用化
-
2017 年 Netflix 開源 Chaos Monkey 由 Golang 重構的 V2 版本,必須整合 CD 工具 Spinnaker 來使用
-
2017 年 Netflix 釋出 ChAP (混沌實驗自動平臺),可視為應用故障註入測試(FIT)的加強版
-
2017 年 由Netflix 前混沌工程師撰寫的新書“混沌工程”在網上出版
-
2017 年 Russell Miles 創立了 ChaosIQ 公司,並開源了 chaostoolkit 混沌實驗框架
-
Latency Monkey 在 RESTful 客戶端到伺服器通訊中引入隨機延遲,以模擬服務降級並測量上游服務是否正確響應。
-
Conformity Monkey 在發現不符合最佳實踐的實體時將其關閉。
-
Doctor Monkey 會在每個實體中執行健康檢查,同時也透過其他外部監控指標來檢測不健康的實體。一旦檢測到不健康的實體,將它們從服務中刪除,並且在實體所有者找到問題的原因後終止。
-
Janitor Monkey 搜尋未使用的資源並按規則處理,以確保AWS上的環境資源有效避免浪費。
-
Security Monkey 在發現安全違規或漏洞時,如發現未正確配置的AWS安全組,並終止使用該違規安全組的實體。此外,還會確保所有的 SSL 和 DRM 證書有效且無需續訂。
-
10-18 Monkey (l10n-i18n)針對多個區域和國家的客戶提供服務的實體,檢查有關語言和字符集的配置。
-
Chaos Gorilla 模擬了 AWS 可用區域(AZ)的中斷,以驗證服務是否會自動平衡至可用的 AZ,而無需人工幹預,也不會給使用者帶來可見的影響。
-
儘量減少實驗的爆炸半徑(故障註入測試的引入)
-
為了確保不會破壞生產業務,工程團隊需“精心策劃”混沌工程實驗
朋友會在“發現-看一看”看到你“在看”的內容