為什么數(shù)字化轉(zhuǎn)型推動(dòng)了對(duì) AIOps 的需求
由于現(xiàn)代應(yīng)用程序的復(fù)雜性,行業(yè)正在經(jīng)歷從獨(dú)立的網(wǎng)絡(luò)和應(yīng)用程序監(jiān)控工具向AIOps的轉(zhuǎn)變。
如今,隨著公司部署新應(yīng)用程序并進(jìn)行數(shù)字化轉(zhuǎn)型,基礎(chǔ)設(shè)施及其對(duì)應(yīng)用程序性能的影響變得越來(lái)越重要。不幸的是,現(xiàn)代應(yīng)用程序底層基礎(chǔ)架構(gòu)的復(fù)雜性使得故障排除和問(wèn)題解決變得更加困難。傳統(tǒng)的監(jiān)控工具達(dá)不到要求。通常需要一種基于AIOps的問(wèn)題識(shí)別和快速解決方法。
在業(yè)界,關(guān)于AIOps的真正含義存在一些爭(zhēng)論。一些實(shí)現(xiàn)使用預(yù)定義的規(guī)則,并根據(jù)是否檢測(cè)到某些條件智能地采取行動(dòng)。例如,如果計(jì)算密集型應(yīng)用程序的性能下降,則將更多數(shù)據(jù)轉(zhuǎn)移到固態(tài)驅(qū)動(dòng)器,啟動(dòng)更多計(jì)算實(shí)例,并減少其他應(yīng)用程序的帶寬消耗。純粹的AIOps解決方案不需要規(guī)則即可工作。AIOps解決方案應(yīng)該自動(dòng)發(fā)現(xiàn)狀態(tài)數(shù)據(jù)和業(yè)務(wù)成果之間的關(guān)系。(在基于規(guī)則的系統(tǒng)下,需要與許多手動(dòng)系統(tǒng)相同的設(shè)置工作量。)
監(jiān)控和管理之間也有區(qū)別。AIOps應(yīng)該提供洞察力,而不是人類(lèi)用戶查看數(shù)據(jù)然后整理出正在發(fā)生的事情。AIOps工具應(yīng)該告訴IT經(jīng)理有一些事情需要注意。AIOps提供的自動(dòng)化目標(biāo)是減少手動(dòng)干預(yù)所花費(fèi)的時(shí)間,并為應(yīng)用程序留出更多時(shí)間。
行動(dòng)中的AIOps
查看AIOps的一種方式是看它與其他監(jiān)控和應(yīng)用程序性能管理方法的不同之處。
例如,客戶在嘗試完成在線交易時(shí)體驗(yàn)不佳。性能或交互緩慢可能是由于多種原因造成的??蛻羰褂玫膶拵ф溄涌赡芎苈?,交易數(shù)據(jù)包通過(guò)的Internet主干網(wǎng)可能擁塞,主應(yīng)用程序服務(wù)器可能因同時(shí)會(huì)話過(guò)多而承受壓力,輔助應(yīng)用程序(例如,拉動(dòng)現(xiàn)有的CRM系統(tǒng))幫助完成交易的客戶信息)的響應(yīng)時(shí)間可能很慢,或者第三方數(shù)據(jù)庫(kù)(例如信用檢查系統(tǒng))可能處于脫機(jī)狀態(tài)。
應(yīng)用程序性能管理的傳統(tǒng)方法是等待客戶發(fā)出關(guān)于交易質(zhì)量差的憤怒電話。然后,運(yùn)維團(tuán)隊(duì)可能會(huì)使用故障排除工具來(lái)嘗試識(shí)別問(wèn)題。然后進(jìn)行更改(也許增加應(yīng)用服務(wù)器的能力)。
更主動(dòng)的方法將發(fā)現(xiàn)客戶有問(wèn)題并實(shí)時(shí)采取糾正措施。例如,運(yùn)營(yíng)經(jīng)理可能會(huì)為CRM系統(tǒng)分配更多帶寬以加快這部分事務(wù)的速度。
這兩種方法都是勞動(dòng)密集型的,并且要求Ops團(tuán)隊(duì)對(duì)來(lái)自大量不同系統(tǒng)的許多日志、跟蹤、警報(bào)和其他數(shù)據(jù)進(jìn)行分類(lèi)。他們必須以某種方式聚合這些數(shù)據(jù),將其關(guān)聯(lián)起來(lái),并嘗試?yán)斫馑哉页鰡?wèn)題的根本原因。
鑒于現(xiàn)代應(yīng)用程序的復(fù)雜性,這不是一種實(shí)用的方法。AIOps平臺(tái)將傳統(tǒng)監(jiān)控工具與流式遙測(cè)相結(jié)合,并使用AI分析所有這些工具。AI分析每個(gè)數(shù)據(jù)源并關(guān)聯(lián)多個(gè)異常以自動(dòng)識(shí)別問(wèn)題,同時(shí)還提供有關(guān)如何解決問(wèn)題的詳細(xì)信息。因此,如果正確實(shí)施AIOps平臺(tái),它不僅可以提供對(duì)潛在問(wèn)題的更多可見(jiàn)性,而且還可以消除許多手動(dòng)故障排除和修復(fù)任務(wù)。
為此,AIOps工具應(yīng)該提供洞察力,而不是人類(lèi)用戶查看數(shù)據(jù)然后整理出正在發(fā)生的事情。該工具應(yīng)該告訴IT或OPs經(jīng)理有需要注意的地方。目標(biāo):AIOps提供自動(dòng)化以減少手動(dòng)干預(yù)所花費(fèi)的時(shí)間,并為應(yīng)用程序留出更多時(shí)間。
最后一句話
現(xiàn)代數(shù)字業(yè)務(wù)需要AIOps工具來(lái)實(shí)現(xiàn)跨IT堆棧的持續(xù)洞察。隨著需要監(jiān)控和管理的系統(tǒng)變得更加復(fù)雜、更加分散,并且更加脫離當(dāng)一切都在本地時(shí)提供的嚴(yán)格控制,這種洞察力變得越來(lái)越重要。
特別是,現(xiàn)代應(yīng)用程序使理解性能和可靠性問(wèn)題的原因變得更加困難。雖然更多的監(jiān)控和警報(bào)功能非常棒,但它們可能會(huì)增加已經(jīng)很忙的IT和運(yùn)營(yíng)人員的工作量。這就是為什么該行業(yè)正在經(jīng)歷從單獨(dú)的網(wǎng)絡(luò)、應(yīng)用程序和設(shè)備監(jiān)控工具向用于IT運(yùn)營(yíng)的人工智能(AI)或簡(jiǎn)稱AIOps的轉(zhuǎn)變。
來(lái)源:千家網(wǎng)