新聞中心
這期內(nèi)容當中小編將會給大家?guī)碛嘘P如何為DevOps和SRE選擇監(jiān)控工具,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
成都創(chuàng)新互聯(lián)專注于襄汾網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供襄汾營銷型網(wǎng)站建設,襄汾網(wǎng)站制作、襄汾網(wǎng)頁設計、襄汾網(wǎng)站官網(wǎng)定制、成都微信小程序服務,打造襄汾網(wǎng)絡公司原創(chuàng)品牌,更為您提供襄汾網(wǎng)站排名全網(wǎng)營銷落地服務。
如何為DevOps和SRE選擇監(jiān)控工具
簡介: 在開發(fā)可靠性或?qū)嵤椥訢evOps實踐時,決策的核心是數(shù)據(jù)。如果不仔細監(jiān)控正常運行時間,網(wǎng)絡負載和資源使用情況等關鍵指標,您將無視在哪里花精力進行開發(fā)或完善操作實踐。幸運的是,可以使用各種各樣的監(jiān)視工具來幫助您收集和查看此數(shù)據(jù)。
在開發(fā)可靠性或?qū)嵤椥訢evOps實踐時,決策的核心是數(shù)據(jù)。如果不仔細監(jiān)控正常運行時間,網(wǎng)絡負載和資源使用情況等關鍵指標,您將無視在哪里花精力進行開發(fā)或完善操作實踐。幸運的是,可以使用各種各樣的監(jiān)視工具來幫助您收集和查看此數(shù)據(jù)。
盡管嘗試完全監(jiān)視系統(tǒng)中的所有內(nèi)容可能很誘人,但更集中的監(jiān)視將更易于實現(xiàn),并為您提供更多可操作的數(shù)據(jù)。當基于對客戶影響的度量標準時,SLO之類的SRE實踐最為有用。確定什么以及如何進行監(jiān)視是一個重要的決定。在這篇博客文章中,我們將帶您了解基礎知識。我們還將建議一些流行的監(jiān)視工具供您考慮。
在哪里實施監(jiān)控
確定在系統(tǒng)體系結構中的哪個位置實施監(jiān)視非常重要。這將使您能夠圍繞監(jiān)視工具開發(fā)體系結構,而不必改造現(xiàn)有代碼。根據(jù)實現(xiàn)的位置,監(jiān)視工具將能夠觀察不同類型的數(shù)據(jù)。以下是最常見的監(jiān)視實現(xiàn)類型的分類,以及提供該監(jiān)視類型的工具示例:
資源監(jiān)視:也稱為服務器監(jiān)視或基礎結構監(jiān)視,它通過收集有關服務器運行方式的數(shù)據(jù)來進行操作。資源監(jiān)視工具報告RAM使用率,CPU負載和剩余磁盤空間。在具有物理服務器的體系結構中,有關硬件運行狀況的信息(例如CPU溫度和組件正常運行時間)也有助于避免服務器故障。在基于云的環(huán)境中,虛擬服務器系統(tǒng)的聚合更為有用。
網(wǎng)絡監(jiān)視:這將查看傳入和傳出計算機網(wǎng)絡的數(shù)據(jù)。您的監(jiān)視工具可捕獲所有組件(如交換機,防火墻,服務器等)中的所有傳入請求和傳出響應。從網(wǎng)絡監(jiān)視收集的數(shù)據(jù)可以與來回的數(shù)據(jù)總量一樣簡單,也可以與特定請求的頻率一樣細微。
應用程序性能監(jiān)視:APM解決方案收集有關整體服務執(zhí)行情況的數(shù)據(jù)。這些工具會將自己的請求發(fā)送到服務,并跟蹤指標,例如響應的速度和完整性。目的是推動對應用程序性能問題的檢測和診斷,以確保服務以預期的水平運行。
第三方組件監(jiān)視:這涉及監(jiān)視體系結構中第三方組件的運行狀況和可用性。在這個微服務時代,您的服務可能取決于外部服務(從云托管到廣告服務器)的正常運行。像應用程序性能監(jiān)視一樣,工具可以根據(jù)自己的請求檢查這些服務的狀態(tài)。
您可能需要在整體解決方案中包括每種監(jiān)視類型中的某些監(jiān)視。優(yōu)先考慮使用健壯的冗余監(jiān)視工具,以確保不會遺漏潛在問題。同時,指標和警報應與服務綁定,以確保與業(yè)務影響相關。
您需要從數(shù)據(jù)中得到什么
擁有可操作的數(shù)據(jù)不僅與數(shù)據(jù)本身有關。為了正確響應監(jiān)視工具報告的內(nèi)容,您需要以最有用的方式顯示數(shù)據(jù)。監(jiān)視工具可以為您做一些事情:
當指標超過特定閾值時觸發(fā)警報 創(chuàng)建事件日志,根據(jù)參數(shù)突出顯示 創(chuàng)建一段時間內(nèi)的指標圖 一目了然地提供關鍵服務運行狀況組件的儀表板 創(chuàng)建可以查詢的日志數(shù)據(jù)庫 在制定開發(fā)決策或?qū)κ录龀鲰憫獣r,請養(yǎng)成自問的習慣:“為了做出最佳選擇,我現(xiàn)在需要考慮什么?” 可視化將包含哪些數(shù)據(jù)以及重要的指標。
開源與購買要考慮的另一個重要點是,您將在哪里找到監(jiān)視工具以及誰來維護它們。開源和可購買的工具各有優(yōu)缺點。
開源監(jiān)控工具
這些工具是免費的,這對于工具預算有限的公司來說是一個優(yōu)勢。它們也是完全可定制的,允許您將它們集成到自己的體系結構中。但是,這種定制將需要專門的開發(fā)時間,也許還需要專門的知識。此外,沒有SLA保證可用性,安全性,更新頻率等。您的團隊將承擔這些責任。
購買的監(jiān)控工具
這些工具成本高昂,但具有開源工具無法提供的強大功能。服務提供商將負責保持工具的功能和最新狀態(tài)。該提供商可能會提供客戶服務,培訓,文檔和其他資源,以幫助您將工具與堆棧集成。在可靠性時代,值得考慮的是進行投資以確保監(jiān)視的眼睛始終保持打開狀態(tài)。
監(jiān)控工具比較
以下是針對您的系統(tǒng)考慮的10種最流行的SRE和DevOps監(jiān)視工具。
AppDynamics 是專注于APM的監(jiān)視平臺。他們提供的其他功能包括基于AI的見解,用于模擬客戶旅程的最終用戶監(jiān)控以及具有集成收益分析的業(yè)務監(jiān)控。您可以注冊免費試用。
DataDog是一個針對云規(guī)模服務的監(jiān)視平臺。它在可視化,警報以及數(shù)據(jù)合并和分析方面具有強大的功能。它們使性能指標與業(yè)務影響相關聯(lián)。DataDog提供免費試用。
Prometheus 是一種流行的開源監(jiān)視工具,提供警報,查詢,可視化和許多其他有用的功能。專門的開發(fā)社區(qū)提供了大量文檔和說明,以幫助您快速入門。
New Relic 是一個監(jiān)視平臺,提供了幾個也可以獨立使用的組件:New Relic APM(應用程序性能監(jiān)視),New Relic Browser和New Relic Infrastructure。他們提供適用于iOS和Android的應用程序,為您提供更多監(jiān)視選項。
Nagios 提供開源( Nagios Core)和可購買的選件(Nagios XI)。它們提供了高度可定制的界面,并可以監(jiān)視整個IT網(wǎng)絡。它們還通過配置向?qū)硗怀銎湟子眯?,以引導用戶設置新的監(jiān)視服務。
Dynatrace 允許與其監(jiān)視平臺進行跨團隊協(xié)作,從而提供一個共享的監(jiān)視數(shù)據(jù)單一存儲庫。它們還包括自主云功能以及將監(jiān)視功能引入部署的物聯(lián)網(wǎng)層的能力。他們還提供免費試用。
Solarwinds 提供了幾種產(chǎn)品,每種產(chǎn)品專門用于監(jiān)視的不同領域:網(wǎng)絡管理,系統(tǒng)管理,數(shù)據(jù)庫管理,IT安全性,IT服務管理,應用程序管理和托管服務提供商。每個都可以免費試用。
Site24x7 專門從事網(wǎng)站監(jiān)視,提供諸如狀態(tài)頁和Web服務(例如AWS和Azure)運行狀況診斷的工具。它們還提供綜合Web事務監(jiān)視,使您可以模擬使用情況并收集指標。他們根據(jù)所需的服務提供幾種定價計劃。
SignalFx 提供了廣泛的微服務集成,使您可以看到服務運行狀況的完整圖片。如果您的服務包含許多第三方組件,則這一點很重要。他們的重點是幫助您從單一模型到微服務模型構建您的體系結構。
PRTG Network Monitor 是一項完整的監(jiān)視服務,可以集成到架構的許多階段和位置。它們在網(wǎng)絡,單個服務器,特定應用程序以及介于兩者之間的所有內(nèi)容上提供監(jiān)視。該提供程序還提供免費版本。
上述就是小編為大家分享的如何為DevOps和SRE選擇監(jiān)控工具了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
網(wǎng)頁名稱:如何為DevOps和SRE選擇監(jiān)控工具
分享網(wǎng)址:http://fisionsoft.com.cn/article/jjcodh.html