鯨品(pǐn)堂|智慧運維平(píng)台之全(quán)息監控

2022-04-25 1008
01
背景介紹


隨著雲(yún)計算、 5G等新型信息通信技術應用深入,電信行業在麵臨網絡轉型及重構挑戰的同時也在探尋通(tōng)過IT運維提升效率、優化成本的解決方案,以提升企業競爭力(lì)。因此,電信行業正在(zài)麵臨架(jià)構容器化演進、自動化向智能化轉型、構建企業級能效中台、一體化運(yùn)營體係以(yǐ)及內化(huà)IT研發能力等應用現狀。


目前運營商都有要求應用部署在指定PaaS平台的趨勢,基於以上背景提出研發輕量(liàng)級運維平(píng)台的思路,通過運維(wéi)平台把微服務管(guǎn)控(kòng)(SCP)、調用鏈跟蹤(iTracing)等核心運(yùn)維能力集成到一起,提(tí)供全息監控能力(lì),實(shí)現運(yùn)維過程中異常現(xiàn)象(xiàng)“事先預警(jǐng)”、問題過程(chéng)中能(néng)夠“事中緩解”、問題發生後能提供手段還原問題場景輔助“事後分析”的全流程覆蓋。


圖片關鍵詞輕量級智慧運維平台目(mù)標


篇幅(fú)所限,本次先介紹智慧運維平台中全息監控相關內容


02
全息(xī)監控


>>>>

需求場景(jǐng)


係統問題的事(shì)前預警(jǐng)、事中緩解、事後分析是問題發展過程的“三段論”,希望通過(guò)將產品運行的(de)關(guān)鍵環節進(jìn)行顯性化的展示(shì),在(zài)此基礎上輔助一定的運維手段,盡(jìn)量在(zài)問題的事前階段捕捉到相(xiàng)關的預警信息並告知對應責任人,將問題消弭於無形(xíng),“係統無障”是我們的終極目標。這些要求,意味著需要隨(suí)時掌(zhǎng)控係統自身運行狀(zhuàng)態以及業務承載信(xìn)息。因此,對(duì)係(xì)統實時監控並以可觀測的方式進行展示,就成了基礎架構的必備“技能”。


>>>>

解決方(fāng)案


全息監控的根(gēn)本原理是(shì)利用全息(xī)數字建模技術,對海量信息提取(qǔ)真正有價值的部(bù)分,實現主屏、業務屏、組件屏、服(fú)務探測(cè)屏的多維度分析,通過提供豐富圖形模板進行展(zhǎn)示,設置各類型(xíng)告(gào)警任務、異常情況,方便快(kuài)速發現(xiàn)問題、解(jiě)決問題。


圖片關鍵詞

全息監控技術方案示意


在本方案中,可從業務、應用、接口服務、技(jì)術組件、虛(xū)擬資源等多層麵進行全棧式監控,快速接入各業務係統,協助業務(wù)係統沉澱行業指標(biāo)規範,適配各類paas環境,支持(chí)輕(qīng)量級部署。具備業務健(jiàn)康度分析(xī)能力,能定期輸出運營報表,實現業務生(shēng)產流程數據透明化大屏展示,為運營決策提供(gòng)依(yī)據,從業務維度感知係統運(yùn)行態勢,持續優化服務,提升係統性能,改進業務流程(chéng),提升用戶滿意度。


>>>>

業(yè)務目標


全息監控的應(yīng)用場景廣泛,可以對(duì)單個應用/組件、業務(wù)流程、業務場景進行監(jiān)控展示。

圖片關鍵(jiàn)詞

圖(tú)片關鍵詞

全息監(jiān)控大屏業務目標規劃流程


全息監控大屏應用流程如上圖,在該流程中,核心步驟為“2、明(míng)確監控(kòng)目標”,其它所有步驟都(dōu)為它(tā)服務。通常來說,監(jiān)控目標大概有這幾種(zhǒng):


1) 展示形象,著重點在說明應用/組件建設效果,可通過全息監控大屏提供先(xiān)進的可視化運維管理(lǐ)能力。
2) 展示業務承(chéng)載狀態,著重點在對業務數(shù)據的觀測,通過實時呈現應用業務指標數據以(yǐ)了解業務(wù)開展情況、業務運行是(shì)否發(fā)生異常(業(yè)務請求數/業務成功率/業務失敗率等出(chū)現劇烈波動(dòng)),以便在必要的時候及時進行人工介入。這個目標適合業務時效性(xìng)要求高的場景,比如線下受(shòu)理類業(yè)務、實時生效類業務等。

3) 展示技術支撐能力,著(zhe)重(chóng)點在對技術能力的觀測,通過實時呈現組件當前(qián)技術指標,以說明被監控對象(xiàng)當前處於什麽狀態(空載/空閑(xián)/忙碌/過載/癱瘓等),業務支撐能(néng)力是(shì)否(fǒu)發生變化(主機(jī)CPU/內存使用率過高、數(shù)據庫慢查詢數變(biàn)多/表空間空閑率極低、Redis連接數過高/被阻塞(sāi)的連接個數(shù)大於0等),以(yǐ)便在必要的時候及時進行人工介入。這個目標適合對硬件設備、數據庫、分布式組件等的監控,比如主機、Mysql、Redis、MQ、ZK等。



在實際項目(mù)落地過程中,可以根據實際情況確定希望通(tōng)過全息監控大屏(píng)實現的監控目標,目標可以是上述的(de)一種,也可(kě)以是數種的組合,具體的以可投入預算和資源決定。


>>>>

係統(tǒng)亮點


圖片關鍵詞

全息監控組件優點總結


整體來說,全息監控在實際生產應用過程中起著重要作用,大致總結了(le)它的(de)幾個特點(diǎn):


  • 交付簡單,使用方便


極簡(jiǎn)部(bù)署:提供極簡部署工具,部署進度可視化。


開箱即用:應用、組件屏、接口服務屏等無需過多配置,無需修改業務代碼即可接入使用,非侵入式數據采集。


  • 業務接入速度快


內置指標體係豐富:根據業務係統提供的(de)指標體係,提供指標圖表庫(kù),通過一(yī)鍵部署快速生成各類通用監控屏,開箱(xiāng)即用。


指標配置簡單:通用指標(主機容器、IaaS資源指標、組件指標、應用健(jiàn)康指標(biāo)、應用所依賴組件健康探測指標、通用(yòng)服務監控指(zhǐ)標等)無需配置,既取即用;特(tè)定業務指標少量配置即可滿足。


大屏(píng)配置簡單:自帶組件屏、服務監控探測屏,開箱即用;監控主屏、業務屏少(shǎo)量配置(zhì)即可展示。


  • 展示能力多元化


圖表展示:提供(gòng)折線、柱狀、餅(bǐng)圖、雷達、地圖等豐富圖形組件(jiàn),支持各類指標的展示。


流程展示:提供可視化流程(chéng)配置,包括流程節點、數據來源(url)、流程布局、告警參數等,支撐各類(lèi)業務流程。


自定義報(bào)表:除提供(gòng)Oracle、Mysql、Redis、MQ等通用組件運行情況報表(biǎo)外,還(hái)可根據業(yè)務要(yào)求快(kuài)速定製個性化報表。


  • 監控範圍全(quán)


立體全業務監控:提供(gòng)從(cóng)前端、應用服務、中間件到雲資源的一站式立體運維監(jiān)控,運維更高效。


全(quán)流程(chéng)可視化監控:匯總業務各環節(jiē)信息,端到端展示(shì)業務流程。


  • 診斷報告輸出效率高


業務係統接入監控後,從IaaS資源、PaaS組件、應用、服務等多層維度診斷,快速輸出診斷報告。


03
應用實戰


以(yǐ)某項目為例,按(àn)照不同的角(jiǎo)色和關注點建設“家寬交付流程監控大屏”。係統主要分為前端與後端,前端進行數據展示,後端(duān)進行數據采(cǎi)集、加工清洗、指標統(tǒng)計。支持數據實時采集、實時加工、實時(shí)展(zhǎn)示,業務流程出現問題進行實時(shí)告警,對數據的展示(shì)進(jìn)行(háng)時間段的(de)偏移,實時偏移量最多不超過1小時;支持數(shù)據按照月(yuè)數(shù)據進行展示環比比較分析。


>>>>

業務指標采(cǎi)集


圖片關鍵詞

指標采集數據流


在本案例中,監控大屏所需指標由大數據平台匯總各業務係統數據後生(shēng)成,並(bìng)通過實時接口提供給大屏使用


>>>>

業務效果


業務端到端全流程說(shuō)明:業務受理->網絡數據製作(zuò)->安裝(zhuāng)工單調度->首響預約->現場施工->竣工確(què)認(rèn)->歸檔計費(fèi)。

圖片關鍵詞圖片關鍵詞

家寬交付流程(chéng)大屏視圖


1) 圓圈裏(lǐ)的是本環節的總量,本環節的(de)總量=藍色圖(tú)示(流(liú)出工單)+紅色圖示(卡單量),例(lì)如業務受理總量為18650,流出工單量為18600,卡(kǎ)單量為50(卡單量為本環(huán)節的卡單量,未流入(rù)到下一環節裏)
2) 圓圈顯示的是主要(yào)指標中的部分指標(biāo),圓圈的流出工單量(liàng)用藍色標(biāo)識(shí),卡單量用橙色標識,卡單量、超時首響工單、待(dài)安裝工單、超時工單的數值當大於配置的閾值時流程箭頭變黃色,當(dāng)大(dà)於更高的閾值則流程箭頭變紅色同(tóng)時出現(xiàn)透明的(de)三角感歎號(hào)。
3) 各個業務流程環節下(xià)的柱狀圖為120柱,是以當前時間(jiān)按照每5分(fèn)鍾(zhōng)一個時間單位(wèi)向前偏移120個5分(fèn)鍾的數據進行展示,柱(zhù)狀圖的上部紅色區域代表的是主流程下的紅色圖例,藍色區域代表的是主流程下的藍色圖例(lì),以現場施工為例,柱狀圖(tú)紅色區域表示待安裝工單,藍色區域(yù)表(biǎo)示已安裝工單,柱狀圖默認為從(cóng)左到右(yòu)進行滾動。
4) 左下角顯示各主要(yào)指標和輔助指標,各指標間可切換,每個指標(biāo)都(dōu)有配置一個基準值,如果當前值(zhí)大於基準值則當前值顯示為(wéi)紅色,指標後有小箭頭表示該指標可往下鑽取,查看指標明細,沒(méi)有(yǒu)小箭頭的指標無數據鑽取功能。
5) 右下角分對指標分地域和時間(jiān)維度展示,地域維度展示(shì)指定地域(yù)的下級地域,例如選擇全(quán)省,則地域下對應各個地市(shì),選擇某個地市則對(duì)應(yīng)地(dì)市下的(de)區縣;時間緯度展示主要是按照開始時間和結束時間進行選(xuǎn)擇,時間維(wéi)度下不展示具體的時間刻度,隻展示量的刻(kè)度(dù),量的刻度可配置(zhì)。
6) 鼠標移動到維(wéi)度趨勢圖(tú)上可以看到當前的量(需要移動到對應的柱狀上或折線點(diǎn)上),如果時間(jiān)刻度選擇一(yī)天,則折線圖上隻展示一個點。
7) 點擊下載按鈕可下載當前指標全量明細數據,數據篩選(xuǎn)條件為“地域”或者“選擇的時(shí)間(jiān)+地域”。

8) 指(zhǐ)標數據統計周期默認為5分鍾。


>>>>

係統間業務拉通


對於業務相(xiàng)關的(de)大(dà)屏,考慮到要(yào)縱向(xiàng)打通業務係統、橫向拉通(tōng)各業務環節,相對複雜一些,需要運維平台和業務係統一起參與、共(gòng)同建設。在共(gòng)建過程中,運(yùn)維(wéi)平台提供數(shù)據采集方案和工具,業(yè)務指標展示工(gōng)具;業務係統提出業務大屏展示要(yào)求(qiú),業務場景涉及到的業(yè)務模塊及模塊間的關係,業務指(zhǐ)標數據源等。


圖片關鍵詞

網格(gé)配送業務監控大屏


>>>>

平台及組件


針對底層平台和公共組件的(de)監控大屏基本屬於集成運維平台後開箱即用,比如JVM、Druid、Zookeeper、RocketMq、Redis、Oracle、主機(CPU/內存)、主機網絡等的監(jiān)控,這些組件的指標采集和展(zhǎn)示大屏都已經內置在運維平台產(chǎn)品裏麵,項目部署的時候隻需要修改相應(yīng)的配置即可。


圖片關鍵(jiàn)詞

全息監控內置的NGINX組件監控大屏


04
智慧(huì)運維平台(tái)後續演進思路


圖片關鍵詞(cí)

智慧運維平台後(hòu)續演進思路


智慧運維平(píng)台產品研發不是一錘(chuí)子買賣,需要緊跟技術(shù)升級、業務演進的腳步,不斷對運維能力進行增(zēng)補和完(wán)善以適應各種新生事物出現。


運維,永遠(yuǎn)在路上。


官方微信公眾號

国产亚洲熟妇在线视频雲計算科技股份有限公司 版權所有 2003-2023

蘇ICP備10224443號-6       蘇公網安備 32011402011374號

国产亚洲熟妇在线视频-亚洲熟妇AV乱码在线观看-亚州国产AV一区二区三区伊在-中文字幕无码人妻少妇免费视频-欧美 日韩 人妻 高清 中文-熟妇人妻中文字幕无码老熟妇-丰满熟女人妻一区二区三-亚洲精品字幕