隨著新一代信息技術加快普及應用,5G、云和人工智能正加速智能社會的到來,三大技術正在重構網絡。隨著我國5G產業快速推進,中國移動、中國聯通、中國電信加快步伐,全業務運營時代已經到來。全業務運營時代的特點是:網絡規模大;業務種類將越來越多。越來越多的人開始進入信息通信網絡且使用各種娛樂、商務、貿易等信息通信服務,一旦網絡安全出現問題,必將帶來十分嚴重的后果。因此,IT運維系統在逐步升級的過程中,除了要支撐多業務、融合計費等需求之外,還要提供高等級的安全保障。
5G時代的到來,為運營商帶來了全新的商業模式,隨著運營商業務發展,業務支撐網絡和業務系統越來越復雜。網絡線路、網絡設備、云資源等基礎設施的不斷增加,使得整個網絡結構變得非常龐大而且復雜;同時隨著業務系統的增加,業務場景越來越多,業務復雜度越也越來越高。在傳統運維管理手段下,對于多段網絡、多層架構的應用,在問題發生時,分析定位、排障的速度相對較慢。
具體表現為如下:
當前,電信運營商面臨著5G、虛擬化、物聯網等技術沖擊的壓力,為推進自身業務數字化,電信運營商建設了大量的IT系統,系統規模呈幾何級增長,加之虛擬化微服務架構復雜多變,同時也急需提升效率、優化成本。北京智和信通電信運營商IT運維方案,通過對各類網絡場景下的跨域資源整合、數據深度挖掘、異常監測、自動化運維等能力,實現電信運營商IT運維從標準化向自動化、智能化、數字化轉型。
2.1.多網融合架構可視化
運營商多采用多網融合架構,一般來講,運營商網絡包括省際和省內骨干網絡,各省內又包含許多城域網,城域網下又有許多用戶駐地網通過接入網連接進來。網絡架構中軟硬件環境涉及的技術復雜,廠商眾多。北京智和信通通過網絡架構拓撲可視化能力,將網絡數據從離線表格轉移至平臺內,從靜態的網絡架構數據轉化為動態智能拓撲,實現全網設備、資源、鏈接關系、IP等實時更新、快速定位。
2.2.核心網絡架構可視化
在動態拓撲上展現設備實時狀態,通過樹形、平面結構聯動展示設備間鏈接關系,按片區、按地域、按層級等多種布局方式劃分網絡,使用不同顏色、粗細、圖標表示被管對象的狀態信息,助力運維人員實時了解網絡架構及全網運行狀態,快速感知資源、鏈路、流量等異常信息。
2.3.基站、機房架構可視化
以2.5D管理視圖對不同品牌、類型、版本的網絡設備、安全設備、存儲、主機、中間件、數據庫、虛擬化、應用服務、視頻監控、動力設備、環境設備等進行統一、全方位、多層次的綜合管理,實時分析資源當前性能和運行狀態,直觀反映資源的動態變化對支撐業務的影響。
2.4.端到端全鏈路可視化
從整體維度到局部維度全面展示電信運營商網絡內設備鏈路各項指標,整體可觀測、可告警、可分析、可統計,通過實時監控各個端口以及每條線路的通斷情況和性能指標,結合專業的流量監控分析能力,對鏈路容量進行即時監控,并生成流量分析報告,為容量規劃提供依據。
2.5.全網資源監控可視化
本方案實現網絡設備信息高頻采集,并結合智能算法,實現對整體網絡架構、設備運行狀態、業務可用狀態的實時信息采集和感知。針對電信運營商網絡內各類設備、業務系統構建統一、智能監控體系,對業務系統、操作系統、基礎設施、主機存儲、數據庫、中間件、虛擬化、云、數據中心機房等全方位監管。屏蔽廠商、型號差異,全面掌握電信運營商網絡整體運行情況和運行效能,能高效、快速、精準進行故障定位診斷。
2.6.視頻設備集中監控
本方案可對不同品牌、不同型號的攝像頭進行統一運維,融合網絡高清、智能分析、多級管控為一體。支持監管視頻監控體系涉及的視頻前端設備(攝像頭、卡口、編解碼器)、傳輸設備(光纖收發器、EPON 等)、內場設備(網絡與安全設備、主機/虛擬機、存儲設備)、機房動力環境等統一接入、集中管理。
視頻監控效果示意圖
2.7.精細化私有云監控
方案基于對私有云中的系統資源、租戶資源的監控,實現云資源的生命周期管理,通過可視化運維編排,進行云管理策略預設配置、云策略批量/定時執行、智能監控巡檢。支持多云納管、持續監控,對云的容量進行智能化分析,為容量優化提供依據。
方案采取用戶自定義設備類型及其設備資源的方式,賦予用戶自定義適配設備的能力,最大可能地支持對不同設備類型的支持。通過自定義設備類型及其設備資源,最大限度上提高了智和網管平臺的管理范圍,真正實現了對設備及其資源的全面化管理,達到管控萬物的目標。
方案通過統一的故障管理平臺,將各個模塊中的監控信息統一采集、分析,實現整個電信運營商網絡中各種事件信息、設備故障、網絡異常、流量異常等告警,以智能化手段進行標準化的分析、壓縮、并歸關聯等,通過多種方式實時傳達告警信息,保證落實到指定人員進行處理,為電信運營商提供主動式的故障解決方案。
全面采集電信運營商所有聯網設備,如存儲、服務器、路由器、交換機、防火墻、虛擬化、云、PTN等設備、資源、應用、服務等狀態信息,通過對告警機制以及閾值的設置,第一時間獲取準確的告警信息,快速定位告警設備,提升告警處理效率,降低因設備故障帶來的損失。
將人工運維與故障自愈結合,無需針對告警進行手動處置,只需預編排告警處理流程,平臺根據場景自動觸發,實現故障自愈。
通過實時發現告警,進行預診斷分析,判斷告警類型和級別,如果是一般告警,平臺進行自動恢復,如果是嚴重復雜告警則通過告警通知、運維工單等形式通知運維管理人員,進行人工處理。同時,將只能有專家處理的各類操作和判斷轉化為可存在于平臺內的流程,形成可保留可復用的運維知識。
對于電信運營商的網絡IP資產,采取統一數據標準,對整體網絡中的IP和MAC進行梳理和管理,記錄MCA和IP的對應關系、IP使用單位并關聯合同附件,IP/合同到期后進行提醒。
建立健全IP資產臺賬,通過自定義多級資產分類,細化資產類別,實現資產分類管控,提高資產精細管理程度。從IP分配、調用、回收等,每一步操作均實現完整記錄,支持追溯,通過平臺實現IP資產整個生命周期的全流程閉環管理,使得IP資產每一次生命周期變更,都有流程可依、都有跡可循,從而實現全面的IP監管。
2.11.1.子網及IP地址信息查看
方案支持端到端規劃、部署、管理和監控IP 地址。通過智能IP掃描能力,定義多層次子網,然后掃描其范圍內每個IP地址的當前狀態,包括IP地址,MAC地址等信息,也可以查看IP段內地址使用詳情,便于IP地址分配管理等。
支持通過端口視圖及列表視圖的形式,展示當前IP地址的使用情況,可查看某個子網的IP現網詳情信息,如IP、掩碼、主機名、設備類型、現網MAC、現網接入設備、現網接入端口、規劃MAC、規劃接入設備、使用人等,可批量分配IP地址。
方案支持通過追蹤IP地址的歷史關聯MAC、接入設備/端口變更記錄等與規劃綁定MAC、規劃接入設備/端口進行對比分析,當與規劃不一致時生成一條異常記錄,從而審核IP/MAC是否正確使用。
2.11.4.IP-MAC綁定
對全網MAC和IP進行配對綁定,并周期性對MAC-IP進行檢測。自動將規劃表中的IP-MAC設置為綁定關系,自動掃描在線終端,當MAC-IP的綁定關系發生沖突時產生告警,保證入網終端安全可信。
傳統的人工巡檢,尤其是應用巡檢,缺乏統一的規范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統計,工作效率比較低,同時耗費較大的人力資源。
本方案依托平臺將以前依賴手工進行的日常巡檢轉換為自動化、定時執行的巡檢策略。制定統一的巡檢指標、巡檢方式、巡檢頻度等,保證巡檢標準化、巡檢范圍、巡檢深度;通過設計巡檢作業、數據采集方式、自動化作業調度等實現日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。
2.13.業務可用性管理
電信運營商業務系統流程從終端用戶側的柜面、手機APP、官網、CRM系統、在線客服系統,到在線計費系統,再到后端核心系統,每個環節互相關聯影響。本方案以保障業務可用性為基礎,通過對承載業務的IT基礎設施構建真實的業務模型。直觀呈現面向服務的業務系統體系架構;準確反映設備異常對核心業務、用戶造成的影響和威脅,快速查明導致業務中斷的故障源,幫助運維人員做出及時響應,保障業務連續性。
2.13.1.業務可用性撥測分析
針對業務應用性能與用戶體驗進行檢測分析,無需安裝插件即可提供開箱即用的主動撥測試業務監測。直觀、便捷地幫助運維人員對電信運營商內辦公系統、支付系統、在線客服系統、在線計費系統、CRM系統、官網、手機APP系統等進行監控,掌握業務的運行狀態和健康水平,了解業務動態變化趨勢,快速定位故障源,降低運營風險。
2.13.2.業務依賴關系可視展示
方案通過構建包含各業務整體流程的調用依賴關系圖譜,展示業務部署中網絡設備間多維度關系拓撲。對從業務的前臺受理到真正完成的整個業務流程所依賴的業務應用、服務器、中間件、數據庫、操作系統等進行實時監控分析,通過可視化的方式呈現業務健康狀況,聯動設備監控,快速定位導致業務健康指數波動的原因,保障核心業務流程穩定、高效。
2.14.全網帶寬、流量監控與回溯分析
方案基于海量流量數據的存儲挖掘,實現對網絡流量的偵測分析。通過網絡流量分析技術,采集、分析、存儲所有網絡流量,回溯分析數據包特征、異常網絡行為,以多維數據分析和深度挖掘為手段,實現數據包層面的流量追蹤,發現潛伏于網絡中的未知攻擊。
提供設備、接口、IP、服務、應用、會話等層級的帶寬監控,實時監控帶寬使用趨勢與帶寬占用分布,并通過圖表展示,快速識別網絡帶寬濫用,分析高帶寬使用情況,識別帶寬消耗較大的應用程序、服務、協議或 IP 地址,避免網絡容量過載,并提升最終用戶網絡體驗。
網絡承載的業務經常發生變更,面對業務的變更運維工程師往往要對大量設備進行操作,此時如果依靠工程師逐一登錄設備進行命令下發、策略配置,將產生大量重復性的工作,不但導致運維效率低下,也不可避免地產生人為配置錯誤。
通過批量作業并行處理能力,實現多設備并發批處理操作。通過自動化流程,將簡單的設備控制操作在大批量設備進行執行,并對執行過程進行監督,對執行結果進行檢查。在安全合規的前提下,將運維人員從整體的變更流程及變更內容的準備中解脫出來,實現網絡變更、設備配置自動化。
針對不同類型的設備,支持進行各種控制、配置操作。
支持不同廠商,如Cisco、HP、Nortel、Juniper、3Com、D-link、Foundry、Dell、Proxim、NetScreen、華為、H3C、銳捷、中興等多家廠商的網絡設備。
方案將電信運營商網絡運維中涉及的服務、命令、操作、執行組件化、策略化,將需要進行的運維服務、操作等以組件、策略的形式托管至平臺中進行維護和管理,通過簡單靈活地編排能力,使用者可以選擇業務場景所需地測,通過可視化拖拽的編排方式進行組合,即可完成應用場景端到端的圖形化編排,最后以多種方式觸發執行即可完成期望的運維變更任務,從而實現高效、穩定、安全的智能運維。
利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復雜的電信運營商網絡中各類運維數據,呈現分析結果,從而幫助運維人員在短時間內更好地理解和獲得更多的信息,幫助運維部門能夠實時了解業務和其所依賴IT資源的運行狀況,以及提供系統運維和優化的指示和依據。
適配各種應用場景,二十四小時不間斷監控,細粒度可達網絡中每個設備、資源和鏈路。所有的網絡故障都一目了然地呈現,大大降低了管理成本,同時也提高了運維人員處理故障的能力,節省的故障處理時間,為運維人員管理網絡提供了可靠的保證。
通過方案實現運維工單“無紙化”,支持于設備和故障管理頁面快速創建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節點上責任到人,實現在快速響應故障的同時,實現兼顧運維流程管控。
結合電信運營商開戶、銷戶、彩鈴、如裝機、 拆機、 加三方通話、減增新業務等業務需求場景,自定義工單模板內的字段,并對字段排序進行調整,使工單根據業務的不同更加貼合用戶實際使用情況,提供為不同工單模板設置不同狀態的能力。
信創產業包含了從IT底層的基礎軟硬件到上層應用軟件的全產業鏈的安全可控,涵蓋了應用軟件、信息安全、IT基礎設置、基礎軟件四個領域。其中,基礎軟件是信息系統最核心的部件,是保障信息系統安全的重要陣地和最后一道防線,其創新應用與自主可控關系到國家安全和利益,也是產業自主發展的基礎。
本方案支持部署運行在中標麒麟、銀河麒麟、紅旗Linux等國產操作系統,支持在達夢、金倉、神州等國產數據庫進行數據存儲,通過東方通等國產中間件提供對外服務[8],支持龍芯、申威等國產CPU架構,并實現對國產化CPU、服務器、數據庫、中間件等IT軟硬件設備的綜合監控與運維管理。
通過部署智和信通電信運營商IT運維方案,構建了自動、自優、自愈、自治的智能運維模式,助力運營商達到統一標準、統一運營、統一管控、統一規劃管理。
實現對所有IT設施不同層次、不同維度的拓撲可視化及性能指標智能分析;建立面向宿主機、虛擬機、容器、5G網元的多維度網絡監測視圖,通過跨硬件層、虛擬層、網元層的統一可視化監控運維能力,降低各技術專業運維難度;實現跨層的可視化,解決了故障快速定界、定責的難題,快速定位故障源,提升排障時效。
智和信通電信運營商IT運維方案成果,其可靠性在電信運營商大規模、高復雜的網環境下得到了驗證,并得到用戶的充分認可。
中國移動是我國三大移動運營商之一,公司主要經營移動通信業務,國內、國際固定電話網絡與設施,語音、數據、圖像及多媒體通信與信息服務,電信增值業務,IP電話業務等國家批準的其他業務,以及與通信及信息業務相關的系統集成等業務。
2010年中國移動通信集團在全國建設了不良信息過濾系統,此系統由不良信息過濾軟件、Windows 服務器、Linux 服務器、數據庫、分流設備、交換機、存儲服務器等構成。
中國移動需要一套集中的OMC(操作維護中心)監控軟件,對不良信息過濾系統的所有的設施進行監控,包括過濾軟件、Windows 服務器、Linux 服務器、數據庫、分流設備、交換機、存儲服務器等。具體需求如下:
智和網管平臺已實現包括設備拓撲、故障管理、性能管理、配置管理以及安全管理等在內的超過1000種基礎網管功能,且支持功能擴展。針對中國移動的具體需求,智和信通提出以下解決方案:
智和運維平臺憑借著優秀的秒級故障監控能力、直觀的拓撲圖界面展示、特有的分省Proxy SNMP網關技術、穩固的故障提示和警報提示,最終在中國移動不良信息過濾系統的北方區域:北京、天津、黑龍江、吉林、遼寧、山東、山西、甘肅、青海、西藏、河南、寧夏共13個省公司 全面上線使用,并通過了極為嚴格的功能驗收和性能驗收。
5.2.北京聯通IPTV網絡運維
中國聯通是我國三大移動運營商之一,公司主要經營移動通信業務,國內、國際固定電話網絡與設施,語音、數據、圖像及多媒體通信與信息服務,電信增值業務,IP電話業務等國家批準的其他業務,以及與通信及信息業務相關的系統集成等業務。
IPTV業務管理平臺提供統一業務監控模塊,實現對華為能力平臺(華為S9306、S5352、S930、華為E1000防火墻)、中興能力平臺(中興2826、4507、8905交換機)、播控網關、IPTV盒端管理平臺、IPTV業務管理平臺等平臺的統一業務監控,監控內容包括網絡、主機、存儲、應用、業務數據等。
最終用戶IPTV統一網管負責對IPTV系統涉及的所有網元(包括服務器、交換機、防火墻、存儲設備)及系統和應用的故障告警、日志、性能、拓撲、歷史數據(保留一年的歷史數據)等信息進行集中管理和展現,并能夠按時、日、月進行統計和輸出報表。
網元數據要求
對于網絡中的節點要求獲取的信息包括但不局限于設備基本信息(IP、類型、名稱等)、設備網卡、網卡流量、CPU內存、CDN信息、存儲信息、設備性能等參數。
故障告警的要求
提供多種告警通知(聲音、短信、郵件等),多種告警分類,登錄失敗應產生告警通知管理員,告警閾值可調節,可以分權分區域進行告警。
日志管理的要求
除了記錄基本的操作外,系統中的各設備都需要建立自己的日志文件,定期傳遞給系統的日志管理,進行集中收集、分析和故障告警。
性能管理的要求
實時監控設備和網絡的狀態,獲取有關CDN 網絡運行的信息及統計數據;并能在所收集的數據的基礎上,提供網絡的性能統計。
集中展現管理
對所管理區域CDN 及EPG全網設備提供網絡拓撲結構,提供分級的網絡拓撲圖像及其相關信息,并根據實際運行情況展現維護和管理網絡資源,包括各網元設備。支持資源的查詢以及統計功能,并且可以實現資源的自動更新。
針對北京聯通IPTV項目的實際需求,智和信通提出了基于智和網管平臺定制開發的解決方案。通過開發擴展,讓智和網管平臺支持各平臺通過SNMP、SNMP Trap、FTP、WebServer等協議接口方式進行數據上報的采集監控的采集方式,使平臺監控模塊可直接采集被監控設備信息。
聯通IPTV網管部署上線后,管理員可以通過IPTV網管對網絡下的所有網元設備(包括服務器、交換機、防火墻、存儲設備)及系統和應用的故障告警、日志、性能、拓撲、歷史數據等信息進行集中管理和展現,并能夠按時、日、月進行統計和輸出報表,方便了管理員對系統的管理,提高了管理的效率。