大數(shù)據(jù)運營階段必須部署大數(shù)據(jù)核心平臺,支持IT、網(wǎng)絡(luò)、私有云等數(shù)據(jù)的訪問,建立IT基礎(chǔ)設(shè)施監(jiān)控和大屏、和私有云平臺可視化大屏,部署統(tǒng)一告警平臺,進行大屏幕、私有云等大屏幕進行大數(shù)據(jù)管理。
運營維護階段需要采集客戶端以及后端性能數(shù)據(jù),采用拓?fù)鋵崟r大屏幕,對用戶體驗進行實時監(jiān)控,大屏幕、瀏覽器用戶體驗和大屏幕,深入分析應(yīng)用程序的端到端性能,并建立企業(yè)業(yè)務(wù)管理座艙,以進行業(yè)務(wù)應(yīng)用與IT系統(tǒng)的關(guān)聯(lián)分析。
智能化操作階段要求部署機器學(xué)習(xí)平臺和深度學(xué)習(xí)平臺,以更好地預(yù)測IT資源,預(yù)測用戶體驗和預(yù)測用戶保留能力,以及應(yīng)用健康對商業(yè)影響的預(yù)測等等。
一個完整的云智能體系結(jié)構(gòu)主要分為三部分:
大數(shù)據(jù)采集部分:建立一套針對硬件設(shè)施、網(wǎng)絡(luò)、主機系統(tǒng)、關(guān)鍵業(yè)務(wù)監(jiān)測、分析、日志采集等大數(shù)據(jù)采集平臺,使得它能快速地采集和顯示監(jiān)測對象的基本信息及其運行狀態(tài),對各種硬件、網(wǎng)絡(luò)、主機系統(tǒng)和關(guān)鍵業(yè)務(wù)的健康度能全面、準(zhǔn)確地評估。
數(shù)據(jù)挖掘部分:構(gòu)建大型數(shù)據(jù)提取標(biāo)準(zhǔn)、管理和建模平臺,通過與之配套的各種大數(shù)據(jù)處理工具,選擇相應(yīng)角色所需的信息;操作策略及操作行為,可自由組合各種界面、大數(shù)據(jù)、功能模塊及處理流程,形成針對此種應(yīng)用場景的定制化工作平臺;處理并處理大數(shù)據(jù)的數(shù)據(jù)。與此同時,大數(shù)據(jù)不斷沉淀,形成大數(shù)據(jù)運營管理倉庫,提供豐富的大數(shù)據(jù)管理工具、插件,為大數(shù)據(jù)的進一步應(yīng)用提供支持。
大數(shù)據(jù)應(yīng)用部分:從海量的數(shù)據(jù)沉淀中,通過成熟的大數(shù)據(jù)分析模型和智能算法,為相關(guān)人員提供重要決策大數(shù)據(jù)依據(jù),在《決策》《管理》《實施》三個角度對“網(wǎng)絡(luò)”、“數(shù)據(jù)中心”、“應(yīng)用”、“安全”、“運營”五個維度進行大數(shù)據(jù)建模,最終實現(xiàn)多維大數(shù)據(jù)的組合分析,輔助大數(shù)據(jù)決策,為大數(shù)據(jù)的運營管理提供支持。
隨著IT行業(yè)的發(fā)展,服務(wù)器規(guī)模不斷擴大,業(yè)務(wù)場景日趨多樣化,這是一個值得關(guān)注的問題。此外,在從不連續(xù)的大量數(shù)據(jù)中找出產(chǎn)生故障的根源時,使用了更多的工具,
報警是運維人員與系統(tǒng)進行溝通的一種方式,運營人員每天有50%的工作內(nèi)容,只有50%在計劃中。隨著更多的企業(yè)上云,運營工作的范圍正在迅速擴展。失效原因日益復(fù)雜,單靠現(xiàn)有經(jīng)驗已經(jīng)無法處理早已不可行,部分故障是已知問題,但由于牽涉面廣暫時不便解決,需要周期性重復(fù)處理。
動力警報基線
常規(guī)固定報警基線存在諸多缺陷,如重復(fù)觸發(fā),則會產(chǎn)生大量報警,且重復(fù)觸發(fā)的報警能掩蓋實際情況?;跉v史數(shù)據(jù)統(tǒng)計值生成動態(tài)報警基線,除了自動生成外,還可以人工創(chuàng)建、修改。
對AI應(yīng)用到整個運維會有一定的價值,一是更主動地對系統(tǒng)數(shù)據(jù)進行采集,實時感知用戶的實際性能體驗,借助機器學(xué)習(xí)技術(shù)進行故障預(yù)測,采用更豐富多樣的告警通知方式。在關(guān)聯(lián)的觀點下,能有效地找出問題的根源,根據(jù)時間順序或邏輯,找出多個現(xiàn)象相互影響的關(guān)系,將報警聯(lián)系起來,降低了人為篩選無用或重復(fù)信息的代價。切入商業(yè)視角,更直接地支持業(yè)務(wù)提升,通過大數(shù)據(jù)技術(shù),打破多個業(yè)務(wù)間的數(shù)據(jù)孤島,更好地體現(xiàn)IT在企業(yè)中的價值。各種API呈現(xiàn)方式靈活多變,不僅有大屏幕、報表、報表等大數(shù)據(jù)技術(shù),以及大數(shù)據(jù)技術(shù),使實時數(shù)據(jù)呈現(xiàn)成為可能,而且在同一區(qū)域視野下,可以顯示更多維度的信息。 云吶統(tǒng)一運維管理平臺,通過對網(wǎng)絡(luò)設(shè)備管理、服務(wù)器管理、存儲設(shè)備管理、業(yè)務(wù)應(yīng)用管理、無線管理、日志分析、辦公設(shè)備/聯(lián)網(wǎng)設(shè)備、動環(huán)系統(tǒng)等本地和異地網(wǎng)絡(luò)的實時監(jiān)控、自動巡檢,精準(zhǔn)采集、分析故障信息,判斷重要數(shù)據(jù)性能指標(biāo),實現(xiàn)大規(guī)模數(shù)據(jù)中心的集中統(tǒng)一管理。如果對云吶統(tǒng)一運維管理平臺有什么疑問,你可以聯(lián)系在線客服,或直接注冊免費試用云吶系統(tǒng)。
當(dāng)IT基礎(chǔ)設(shè)施運行時,優(yōu)化用戶體驗和業(yè)務(wù)操作,實現(xiàn)三個方面能力的提高,那么有沒有必要做更多的事?對于這一問題,我們可以從以下幾個方面做進一步的思考:
交叉系統(tǒng):能統(tǒng)一地對多個系統(tǒng)數(shù)據(jù)進行匯總,并整理出相應(yīng)的模型,把原來孤立的數(shù)據(jù)孤島聯(lián)系起來。
高效:看不見故障現(xiàn)象,不會割裂,能迅速地在多個現(xiàn)象中,理清因果關(guān)系,并迅速地挖掘出根因。
高度精確:最大限度地避免了人為判斷中引入的干擾,使分析結(jié)果的可行性得到極大提高。而且隨著故障處理次數(shù)的增加,能給出相應(yīng)的處理意見。
針對企業(yè):從最后和最重要的業(yè)務(wù)角度出發(fā),自影響業(yè)務(wù)的結(jié)果,不斷擴展需要考慮的影響因素?;谠撃P?,可以真正發(fā)現(xiàn)運營和運營數(shù)據(jù)之間的相關(guān)性。