浩鯨云計算科技股份有限公司 版權所有 2003-2023
News
News
網絡割接是運營商網絡運維中常見工作內容,割接專業涉及多專業,包括無線、傳輸、數據、接入、動環等,不同專業割接流程及操作差異較大,但當前有一個共同的問題是只能實現簡單的流程化支撐,割接過程關鍵操作都極度依賴人工,包括割接影響分析、割接操作、風險識別、割接驗證等,割接效率不高,更重要的是割接出錯時常發生,最終影響使用感知。
本文通過分析PON接入網割接的各環節規律,探索接入網割接自動化的方法,擺脫對人工的過度依賴,提升割接成功率,降低對業務的影響。
當前接入網割接存在的問題:
割接業務影響無法快速識別
網絡割接影響哪些業務與客戶,需要人工在資源系統查找割接設備節點及下掛子設備節點,并根據“業務鏈路”及“物理鏈路”組合查找割接設備承載業務所關聯的客戶,即受影響客戶,之后通過接口或線下表格導入進來,此過程操作繁瑣且由于PON網絡具有層級多、鏈路多等特性,人工過濾篩選方式識別出來的影響客戶往往不夠準確,影響后續精準客戶關懷。
無法實時準確判斷割接狀態
網絡割接影響影響用戶業務使用,割接期間需要實時監測相關網絡的業務質量、網絡質量的變化情況,判斷割接進展是否異常,是否需要即時中止、回退割接等,目前這些均通過人工觀察分析,面對眾多的指標數據極易監測疏漏,往往難以及時準確判斷割接狀態。
缺乏對割接風險自動識別能力
網絡割接操作過程,涉及對關鍵設備的操作,缺乏操作權限自動監管;對操作腳本和指令是否帶風險,缺乏系統自動判斷能力。割接風險自動識別能力的缺失,降低了PON網絡割接的成功率。
人工割接驗證與復盤耗時耗力
割接結束后,需要對PON網絡質量、業務質量進行驗證,以確認割接完成后網絡和業務恢復正?;蜻_到預期的新水平,這也涉及大量指標比對分析。同時,割接復盤需要對大量割接過程信息進行提取,對割接存在問題進行分析,輸出改進舉措。
01 PON業務網絡自動割接整體思路
PON網絡割接業務流程主要包含割接準備、割接執行、割接驗證三大環節,每個環節在現階段生產應用中,還是比較依賴人工,因此針對這三大環節進行流程改進優化,引入自動數據采集、自動影響分析、自動值守、自動復盤、風險監控以及基于網絡指標割接驗證模型的智能化驗證等能力,實現PON網絡運維高效可靠的割接支撐,提高割接效率和風險把控,促進網絡運維自智水平。以割接50個PON口割接為例,自動化割接流程后,預計操作時間可以從小時級到分鐘級,節約人力、減少風險。
PON網絡自動割接整體思路:
割接準備 針對割接設備的IP,從綜合網管、性能中心、告警中心等系統自動采集告警、性能、設備狀態、用戶在線情況等數據,同時對接資源系統自動進行割接影響分析。 割接執行 針對當前割接,啟動自動值守功能,代替人工實時監控網元的告警數據和性能指標數據,若發生異常,則自動提醒。在割接操作時進行風險監控,自動識別割接人員是否在執行風險指令,若識別出風險指令,則詳細記錄風險操作日志,并發出提醒通知相關人員。 割接驗證 在割接完成后對PON網絡設備進行自動割接驗證,驗證割接設備影響的下級設備是否狀態正常、性能指標正常,是否有告警等,保障割接后網絡質量和業務質量的穩定。 割接完成 割接完成并驗證網絡已經恢復正常,那么系統自動解除告警攔截和屏蔽,并輸出割接總結報告,自動復盤記錄本次割接的設備信息、操作信息、驗證信息等數據。同時啟動網絡質量動態監測,從多維度對割接后的網絡質量進行監測,與割接前的網絡質量進行比較,判斷網絡是否恢復正常。 02 PON網絡自動割實現要點 準備階段—采集數據
當通過系統創建割接工單并錄入待割接設備信息時,系統通過對接外系統自動采集割接的設備及子設備的告警信息、性能信息、用戶在線情況等數據。
對割接所需的信息數據,系統自動識別采集,并入庫,以作割接完驗證的基本數據。對接的外系統包含網管系統、撥測系統、性能中心、告警中心、資源系統等,統一對接入口管理。
自動采集PON設備性能指標信息 采集割接設備下掛的光貓、OLT、ONU、OBD等設備的性能數據,包含設備光功率信號、誤碼、用戶數、設備CPU使用率、內存使用率、端口輸入輸出流量等。 自動采集PON設備承載業務的用戶在線情況 采集割接設備及下掛設備的承載業務的用戶在線情況,業務包含寬帶、IPTV、ITMS、互聯網專線、VPN專線等。按照割接前一周時間進行采集,用于做割接后數據對比,如一周的環比和前一天的環比。 自動采集PON設備告警信息 采集OLT/ONU等PON網絡設備是否有光信號丟失等告警,是否有影響業務、設備的告警。 準備階段—影響分析
通過割接的設備IP,系統自動進行影響分析,調取資源系統數據,獲取割接影響的設備節點、寬帶客戶清單、電路清單等數據,再通過影響分析規則判定是否為割接影響的設備、客戶、電路。
自動分析影響設備節點 網元庫根據設備IP,提供割接設備及下掛設備的所有 設備節點信息,通過建立規則分析是否為割接設備下掛子設備節點、割接所封鎖的資源,來篩選影響設備節點。 自動分析影響業務及用戶 根據設備IP,提供割接設備及下掛設備的所接入的所有 “客戶信息”、“業務信息”,通過建立規則分析是否為割接設備承載業務所關聯的客戶,來篩選出影響的用戶清單。 自動分析影響電路 提供割接設備所涉及的所有的“業務鏈路”及“物理鏈路”信息,通過建立規則分析是否為割接設備關聯的物理鏈路和業務鏈路,來篩選出影響的電路清單。 執行階段—割接值守
在PON網絡的割接操作一般都會影響用戶業務的使用,因此在每次執行割接任務時,割接前、割接中、割接后都需要有人員觀察業務質量、網絡質量變化等情況,且割接時間通常選在凌晨,割接人員易疲憊,面對眾多的指標數據容易出現監控疏漏。
對此構建自動值守能力,即引入業務質量和網絡質量自動監控能力代替人員監控,實現割接前、割接中、割接后智能自動值守,包含實時監控感知異常指標數據,如網絡質量、業務流量、用戶在線情況、設備告警等。
在割接全流程中,無間斷監控網絡狀態,發現異常能及時報警,并通知相關人員進行處理,高效可靠的保障割接順利完成。
自動監控 系統在割接前、割接中、割接后自動監控,無間斷實時監控割接所在網絡的網絡質量、業務質量、用戶在線、相關設備告警等情況。 趨勢預測 利用AI能力指標趨勢預測模型自動判斷設備流量、光功率等指標的情況是否有異常趨勢,與割接前一周的數據進行同比和環比,或通過模型訓練的動態閾值判斷指標是否異常。 多視角監控 提供監控內容定制化,根據用戶權限、用戶工作性質、監控重點等維度調整監控信息,包含值守人員視角監控、操作人員視角監控、領導視角監控等。 自動異常報警 自動值守時發現指標劣化異常、用戶在線情況異常等及時報警提醒相關人員進行處理。
示例:提供實時流量監測能力,根據當天數據流量趨勢,與前一天的流量、一周前的流量等數據進行同比和環比,計算動態基線,預測割接后的流量,看和實際流量是否有較大出入,若偏離動態基線過多,則進行預警通知相關人員處理。
如上圖所示,監測業務流量波動情況,針對輸入和輸出流量進行異常監測識別。根據實時監測實際值和預測值對比,實際值在割接時間內(16-12:00左右)波形驟降,發出預警提示。
執行階段—風險監控
通過設置風險操作識別規則,實現對割接風險操作自動識別、風險操作攔截。當割接中,若有人執行的操作指令是風險操作,系統自動識別操作風險,并自動判斷執行人是否有權限操作,有權限進行風險操作提醒,并記錄操作詳細日志,無權限則進行攔截預警、限制操作。
風險操作識別 如軟件大版本升級、網絡結構變更、核心設備中斷或重啟等操作,采用屏幕操作監控、指令輸入識別方式對風險操作進行識別。提前設定風險操作指令識別規則、屏幕風險操作識別規則進行識別,如判斷登錄網管系統是否正確、系統輸入的指令是否有風險等。 風險操作權限判斷 對識別的風險操作判斷是否有操作權限,若當前用戶無權限則及時攔截預警,若當前用戶有權限進行操作,則自動記錄操作詳細日志。日志信息包括操作人、操作內容、操作時間、風險等級等。 驗證階段—割接驗證
割接操作后,需對PON網絡質量、業務質量等指標進行割接驗證:如BRAS、 OLT、ONU、用戶終端的相關性能指標、告警、用戶在線情況等數據進行割接驗證。在此引入基于網絡指標割接驗證模型的智能化驗證能力,實現自動、智能的驗證割接后網絡各項指標數據,以確保割接完成后網絡和業務恢復正常。
建立網絡指標割接驗證模型,通過采集的割接待驗證指標數據,自動進行割接前后數值比對,自動判斷割接后這些指標數據是否異常,從而判斷網絡是否恢復,從而實現割接驗證的自動化。
歸檔階段—割接復盤
割接完成后,確定網絡恢復正常,系統自動撤回割接前的告警屏蔽和工單攔截,并將割接流程的關鍵信息自動保存記錄,并輸出報告。
自動復盤核心舉措是對割接關鍵信息,包括割接設備信息(硬件及網絡拓撲)、割接操作及異常處理信息、割接人員及時間安排信息、割接驗證信息等,自動進行關鍵點分析,形成完整割接報告,提供割接管理者參考,幫助其制訂進行割接方案改進、割接處理流程優化、人員畫像更正、網絡質量持續監控等措施。
割接后評估—持續動態監測
對于割接完成PON網絡,需在割接完成后的一段時間,一般保持7天持續網絡質量監測,保障割接后網絡質量和業務質量趨于穩定,而目前行業內還未有較為完善的方案進行割接后評估。
因此,通過構建割接后評估模型,多維度綜合分析割接后的網絡情況,包含質差網絡分析、質差業務分析、用戶在線情況分析、告警關聯分析。分析到異常問題,則證明割接任務對網絡質量造成了影響,需要派發處理工單給相關人員,工單處理完成進行反饋,更新調優割接后評估模型。
本文主要為解決PON網絡割接效率低、割接風險大、指標監控難等問題提出解決思路,通過對整個割接流程賦予自動化、智能化的能力,包含自動采集數據、自動影響分析、割接自動值守、操作風險自動監控、基于網絡指標割接驗證模型的自動驗證、割接自動復盤評估、割接后評估等能力,提升網絡割接的效率與準確性,從而降低人工出錯率。未來也可擴展到其他專業的網絡割接場景,包含無線、傳輸、數據、接入、動環等專業的割接場景。