網絡割接(jiē)是運營商網(wǎng)絡運維中常見工作內容,割接專業涉及(jí)多專業,包括無線、傳輸、數據、接入、動環等,不同專業割接流程及操作(zuò)差異較大,但當(dāng)前有一個共同的問題是隻能實現簡單的流程化支撐,割接過程(chéng)關鍵操(cāo)作都極度依賴(lài)人工,包括割接影響(xiǎng)分析、割接操作、風險識別、割接驗證(zhèng)等,割接效率不高,更重要的是割接出錯時(shí)常發生,最終影響使用感知。
本文通過(guò)分析PON接入網割接的各環節規律,探索接入網(wǎng)割接自動化的方(fāng)法,擺脫對人工的過度依賴,提(tí)升割接成功率,降低對業務的影響。
當前接入網割接存在的問題:
網絡割接影響哪些業務與客戶,需要人工在資源(yuán)係統查(chá)找割接設備(bèi)節點及下掛子設備節點,並根據“業務鏈路”及“物理鏈路”組合查找割接設備(bèi)承載業務所關聯(lián)的客戶,即受影響客戶,之後通過(guò)接口或線下(xià)表格導(dǎo)入進來,此(cǐ)過程操作(zuò)繁瑣(suǒ)且由於PON網絡具有層級多、鏈路多等特性(xìng),人工過濾篩選方式識別出來的影響(xiǎng)客戶往往不夠(gòu)準確,影響後續精準客戶關懷。
網絡割接影響影響用戶業務(wù)使用,割接期間需要實時監測相關(guān)網絡的業務質量、網絡質量(liàng)的變化情況,判斷割接進展是否異常,是否需要即時中止、回退割(gē)接等,目前這些均通過人工觀察分析,麵(miàn)對眾(zhòng)多的指標數(shù)據極易監測疏漏,往往難以及時準確判斷割接(jiē)狀態。
網絡割接操作(zuò)過程,涉及對關鍵設備(bèi)的操作(zuò),缺乏操作權限自動監管;對操作腳本和指令是否帶風險,缺乏係統自(zì)動判斷能力。割接風險自動識別能力的缺失,降低了PON網絡割接的成功率。
割接結束後(hòu),需要對PON網絡質量、業務質量進行驗(yàn)證,以確認割接完成後(hòu)網絡(luò)和(hé)業務恢(huī)複正常或達到預期的新水平,這也涉及(jí)大(dà)量指標比對分析(xī)。同時,割接複盤需要對大量割(gē)接過程(chéng)信(xìn)息進行提取,對割接存在問(wèn)題進行分析,輸出改進舉措。
PON網絡割接業務流程主要包含割接準備、割接執(zhí)行、割接驗證三大環節,每個環節(jiē)在現階段生產應用中,還是(shì)比較依賴人工,因此針(zhēn)對(duì)這三大環節進行流程(chéng)改進優化,引入自(zì)動數據采集、自動影響分析、自動值守、自動複盤、風險監控以及基(jī)於網絡指標割接(jiē)驗證模型的智能化驗(yàn)證等能力,實現PON網絡運維高效可靠的割接支撐,提高割接效率和風險把控,促進網絡運維自智水平。以割接50個PON口割接為例,自動(dòng)化割接流程後(hòu),預計操作時間可以從小時級到分鍾級,節約人力、減少風險。
PON網(wǎng)絡自動割(gē)接整體思路:

針(zhēn)對割接設備的(de)IP,從綜合網管、性(xìng)能(néng)中心、告(gào)警中心等係統自動采集告警、性能、設備狀態、用戶在線情況等數(shù)據,同時(shí)對接資源係統自動進行割接影響分析。
針對當前割接,啟動自動值(zhí)守功能,代(dài)替人工實時監控網元的告警數據和性能指標數(shù)據,若發生異常,則自動提醒。在割接操作(zuò)時進行(háng)風(fēng)險監控,自動識別割(gē)接人員是否在執行風險(xiǎn)指令,若識別(bié)出風險指令,則詳細記錄風險操作日誌,並發出提醒通知(zhī)相關人員。
在割接完成後對PON網絡設備進行自動割接驗(yàn)證,驗證割接設備影(yǐng)響的下級設備是否狀態正常、性能指標正常,是否有告警等,保障割(gē)接後網絡質量和業務質量(liàng)的穩定。
割接完成並驗證(zhèng)網絡已經恢(huī)複正常,那麽係統自動解除告警攔截和屏蔽,並輸(shū)出割接總(zǒng)結報(bào)告,自動複盤記錄本次割接的設備(bèi)信息、操作信息、驗證信(xìn)息等數據。同時啟動網絡質量動態監測,從多維度對割接後的網絡質(zhì)量(liàng)進行監測,與割接前的(de)網絡質量進行比較,判斷網絡是否恢複正常。
當通過係統創建割接工單(dān)並錄入(rù)待割接(jiē)設備信息時,係統通過對接外係統自動采(cǎi)集割接的設備及子設備的告警信息、性能信息、用戶在線情況等數據。
對割接所需(xū)的信息數(shù)據,係(xì)統自動識別采集,並入庫,以作割接完驗證的基本數據。對接的外係統包含網管係統、撥(bō)測係統、性能中心、告警中心、資源係統等,統一對接入口(kǒu)管(guǎn)理。

采集割接設備下(xià)掛的光貓、OLT、ONU、OBD等設備的性能數據,包含(hán)設(shè)備光功率信號、誤碼、用戶數、設備CPU使(shǐ)用率、內存使用率(lǜ)、端口輸入輸出流量等。
采集割接設備及下掛設備的(de)承載業務的用(yòng)戶在線情況,業(yè)務包含寬(kuān)帶、IPTV、ITMS、互聯網專線、VPN專(zhuān)線等。按照割接前一周時間進行采(cǎi)集,用於做割接後數據對比,如一周的(de)環比和前一天的環比。
采集OLT/ONU等PON網絡設備(bèi)是否有(yǒu)光信號丟失等告警,是(shì)否有影(yǐng)響業務、設備的(de)告警。
通過割接的設備IP,係統自動進行影響分(fèn)析,調取資源係(xì)統數據,獲取割(gē)接影響(xiǎng)的設備節點、寬帶(dài)客戶清單、電路清單等數據,再(zài)通過影響分析規則判定是否為割(gē)接影響的設備、客戶、電路。

網元庫根據設備IP,提供割接設備及下掛設備的所(suǒ)有 設備節點信息,通過建立(lì)規則分析是否為割接設備下掛子設備節點、割接所封鎖的資源,來篩選影響設備節點。
根據設(shè)備IP,提供割接設(shè)備及(jí)下掛設備的所接入的所有 “客(kè)戶信息”、“業務信息(xī)”,通過建立規則分析是否(fǒu)為割接設(shè)備承載業務所關聯的客戶,來(lái)篩選出影(yǐng)響的用(yòng)戶清單。
提供割接(jiē)設備所涉及的(de)所有的“業(yè)務(wù)鏈路”及(jí)“物理鏈路”信息,通過建立規則分析(xī)是否為割接設備關聯的物理鏈路和業務鏈路,來篩(shāi)選出影響的電路清單。
在(zài)PON網絡的割接操(cāo)作一(yī)般都會影響用戶業務的使用,因此在(zài)每次執行(háng)割(gē)接任務時,割接前、割接中、割接(jiē)後都需要有人員觀察業務質量、網絡質量變(biàn)化等情況,且割接時間(jiān)通常選在淩晨,割接人員(yuán)易疲憊,麵對眾(zhòng)多的指標數據容易出現監(jiān)控疏漏。
對此構建自動值守能(néng)力,即引入業務質量和網絡質量自動監控能(néng)力代替人員監控,實現割接前、割接中、割接後智能自動值守,包含實時監(jiān)控感知異常指標數據(jù),如網絡質量、業務流量、用戶在線情況、設備告警等。
在割接全流程中,無(wú)間斷監控網絡狀態,發現異常(cháng)能及時報警,並通知相關人員進行處理,高效可靠的保障割接順利完成。

係統在割接前(qián)、割接中、割接後自動監控,無間斷實時監(jiān)控割接所在網絡(luò)的網絡質量、業務質量、用戶在(zài)線、相關設備告警(jǐng)等情況。
利用AI能力指標趨勢預(yù)測模型自動判斷(duàn)設備流量、光功率等指標的(de)情況是否有(yǒu)異常趨勢,與割接前一周的數據進行同比和環比,或通過模型訓練的動態閾值判斷指標是否異(yì)常。
提供(gòng)監控(kòng)內容定製化,根據用戶權限、用戶工作性質、監控重點等維度調整監控信息,包含(hán)值守人員(yuán)視角(jiǎo)監控、操作人(rén)員視角監(jiān)控、領(lǐng)導(dǎo)視角監控(kòng)等。
自動值守時發現指標劣化(huà)異常、用戶在線情況異常等及時報警提醒相關人員進(jìn)行處理。
示例:提供實時流量監測能力,根據當天數據流量趨勢,與前一天的流量、一周(zhōu)前的流量等數據進行同比和環比,計算動態基線,預測割接後的流量,看和實際流量(liàng)是否有較大出入,若偏離動態基線過多,則進行預警通知相關人員(yuán)處理。

如上圖所示,監測業(yè)務流量波動情況,針對輸入和輸出流量進(jìn)行異常監測識別。根據實時監測實際值和預測值對比,實際值在割接時(shí)間內(16-12:00左右)波形驟降,發出預(yù)警提示。
通過設置風險操作識別規則,實現對割接風險操作自動識別、風險操作攔截(jié)。當割接中,若有人執行的操作指(zhǐ)令是風險操作,係(xì)統自動識別(bié)操作風險,並自動判(pàn)斷執行人是否有權限操作,有權限(xiàn)進行風險操作提醒,並記錄操(cāo)作詳細日誌,無權限(xiàn)則進行攔(lán)截預警、限製(zhì)操作。

如(rú)軟件(jiàn)大版本升級、網(wǎng)絡結構變(biàn)更、核心設備中斷或重啟等操作,采用屏幕操作監(jiān)控、指令輸入識別方式對風險操作進行識別。提前設定風險操作指令識別規則、屏幕(mù)風險操作識別規(guī)則進行識別,如判斷登錄(lù)網(wǎng)管係統是否正確、係統(tǒng)輸(shū)入的指令是否有風(fēng)險等。
對(duì)識別的風險操作判斷是否有(yǒu)操作權限,若當前用戶無權限則及時攔截預警,若(ruò)當前用戶有權限進行(háng)操作(zuò),則自動記錄操作詳細日誌。日誌(zhì)信息包(bāo)括操作人、操作內容、操作時間、風險等級等。
割接操作後,需對PON網絡質量、業務質量等指標進行割接驗(yàn)證:如BRAS、 OLT、ONU、用戶終端(duān)的相(xiàng)關性能指標、告警、用戶在線情況等數(shù)據進行割接驗證。在此(cǐ)引入基於網絡指標割接驗證模型的智能化驗(yàn)證能力,實現自動(dòng)、智能的驗證割接後(hòu)網絡各項指標數據,以(yǐ)確保割(gē)接完成後網絡(luò)和業務恢複正常(cháng)。
建立網絡(luò)指標割接驗證模型,通過采(cǎi)集的割接待驗(yàn)證指標數據,自動進行割接(jiē)前後數值比對,自動判斷割接後這些指標數據是否異常,從而判斷(duàn)網絡是否恢複,從而實現割接驗證的自動化。

割接完成後,確定網絡恢(huī)複正常,係統自動撤回割接前的告(gào)警屏蔽和工單攔截,並將割接流程的關鍵信息自動保(bǎo)存記錄,並輸出報告。
自動複盤核心舉措是(shì)對(duì)割接關鍵信息,包括(kuò)割接設備(bèi)信息(硬件及網(wǎng)絡拓撲)、割接操作及異常處理信息、割接(jiē)人員及時間安排信息、割接驗證信息等,自動進(jìn)行關鍵點分(fèn)析,形成(chéng)完整割接報告,提供割接管理者參(cān)考,幫助其製(zhì)訂進行割接方案改進、割接處理流(liú)程優化(huà)、人(rén)員畫像更正、網絡質量(liàng)持續監控等措施(shī)。

對(duì)於割接完成PON網絡,需在割接完成後的一段時間,一(yī)般保持7天持續網絡質量監測,保障割接後網絡質(zhì)量和業務質量趨於穩(wěn)定(dìng),而目前行業內還未有(yǒu)較為完善的方案進(jìn)行(háng)割接後評估。
因此,通過構建(jiàn)割接後評估模型,多維度綜合分(fèn)析割接後的網絡情況,包含質差網絡分析、質差業(yè)務分析、用戶在線情況分析、告警關聯分析(xī)。分析到異常問題,則證明割接任務對網絡質量造成(chéng)了影響,需要派發處理工單(dān)給相關人員,工單處理完(wán)成進行反饋,更新調優割接後評估模型。

本文主要為解決PON網絡割接效率低、割接風險大、指標監控難等(děng)問題提(tí)出解決(jué)思路,通過對整個(gè)割接流程賦予(yǔ)自動(dòng)化、智能化的(de)能力,包含自動采集數據、自(zì)動影響分析、割接自動值守、操作風險自動監控、基於(yú)網絡指標割接驗證模型的自動驗證(zhèng)、割接(jiē)自(zì)動複盤評估、割接後評估等(děng)能力(lì),提升網絡割接的效(xiào)率與準確性,從而降低人工出錯率。未來也可擴展到其他專業的網絡割接(jiē)場景(jǐng),包含無線、傳輸、數據、接入、動環(huán)等專業的割接(jiē)場景。