書單丨5本書感受運維技術的魅力

管理員賬號

2019-09-24

中國互聯網發展非常迅速

尤其是在大數據復雜場景下

我們對運維有了新的期待以及更高的要求

NO. 1

《SRE生存指南:系統中斷響應與正常運行時間最大化》

【美】Nat Welch 著

馮文輝 譯

站點可靠性工程(SRE)專注于如何確保系統穩定、可靠地運行。本書基于一個金字塔層次結構模型,深入淺出地介紹了關于SRE的方方面面,涉及監控、事故響應與回顧、測試與發布、容量規劃、開發、用戶體驗設計,以及貫穿其中的溝通技巧。

本書是SRE工程師、DevOps工程師、運維工程師和系統管理員不可或缺的參考資料;軟件架構師、軟件工程師、用戶體驗設計師也能從本書中獲取關于SRE的相關知識。

NO.2

《SRE:Google運維解密》

【美】Betsy Beyer等 編著

孫宇聰 譯

在本書中,Google SRE的關鍵成員解釋了他們是如何對軟件進行生命周期的整體性關注的,以及為什么這樣做能夠幫助Google成功地構建、部署、監控和運維世界上現存最大的軟件系統。通過閱讀本書,讀者可以學習到Google工程師在提高系統部署規模、改進可靠性和資源利用效率方面的指導思想與具體實踐——這些都是可以立即直接應用的寶貴經驗。

NO.3

《混沌工程:Netflix系統穩定性之道》

【美】Casey Rosenthal 等 著

侯杰 譯

Netflix官方出品,保障系統穩定性、確保架構彈性可伸縮的新方法!

本書介紹了 Netflix 的工程師團隊是如何根據多年實踐經驗主動發現系統中脆弱點的一整套方法。這套方法現在已經逐漸演變成計算機科學的一門 新興學科,即“混沌工程”。通過一系列可控的實驗和執行實驗的原則,混沌工程將揭示出分布式系統中隨時發生的各類事件是如何逐步導致系統整體不可用的。

NO.4

《智能運維:從0搭建大規模分布式AIOps系統》

彭冬 朱偉 劉俊 等 著

直接來自新浪微博智能運維團隊多年的探索與實踐,技術思路可落地,解決方案有說服力。面向運維熱點方向,詳細分析底層原理,全面梳理技術體系,完整呈現從方法創新到工具化實踐。

本書結合大企業的智能運維實踐,全面完整地介紹智能運維的技術體系,讓讀者更加了解運維技術的現狀和發展。同時,幫助運維工程師在一定程度上了解機器學習的常見算法模型,以及如何將它們應用到運維工作中。

NO.5

《Linux運維之道(第2版)》

丁明一 編著

運維案頭書,紅帽推薦,大量經典案例、問題分析,內容全面升級至CentOS7.2。

本書將圍繞Linux操作系統這樣一個基礎平臺,講解如何使用操作系統實現各種開源產品的應用案例。全書主要從運維工作中的應用服務入手,全面講解基本Linux操作系統以及各種軟件服務的運維工作。

讀者評論

相關專題

相關博文

  • 聊聊高并發之隔離術

    聊聊高并發之隔離術

    張開濤 2017-04-21

    隔離是指將系統或資源分割開,系統隔離是為了在系統發生故障時能限定傳播范圍和影響范圍,即發生故障后不會出現滾雪球效應,從而保證只有出問題的服務不可用,其他服務還是可用的;而資源隔離有臟數據隔離、通過隔離后減少資源競爭提升性能等。我遇到的比...

    張開濤 2017-04-21
    1325 0 0 0
  • 了解智能一體化

    了解智能一體化

    陳紹英 2017-04-21

    了解智能一體化測試平臺 智能一體化測試平臺是為支持智能一體化測試理論而開發的平臺,這個平臺主要面向后臺系統的服務/接口測試。借助這個平臺,開發測試人員進行服務/接口測試時可以將工作重心集中在測試案例設計與管理上,測試執行與分析主要交...

    陳紹英 2017-04-21
    332 0 0 0
  • 書單丨人工智能——未來科技之巔

    書單丨人工智能——未來科技之巔

    管理員賬號 2017-03-23

    從AlphaGo肆虐圍棋界,到人工智能創業大軍的崛起,都預示著我們即將步入“AI”的時代。谷歌(Google)、臉書(Facebook)、百度、阿里巴巴等一系列國內外大公司紛紛對外公開宣布了人工智能將作為他們下一個戰略重心。 人工...

    管理員賬號 2017-03-23
    549 0 0 0
0k000澳客网竞彩