• 客服热线:400-670-0056

集中化管理平台

政企专线业务-传输端到端运维管理解决方案

目录

一、面临的挑战

二、解决思路

三、整体方案

四、个人工作台

五、重要业务路由单点预警及影响分析

六、OTN业务配置合规性自动核查

七、CMDB:4G和家宽业务端到端监测分析

八、告警管理

九、配置自动化管理(PTN 网络)

十、性能管理分析

十一、作业计划管理

十二、隐患管理

十三、割接备案(变更管理流程)—业务割接风险评估

十四、应急资源调度

十五、故障管理—业务影响PING测验证

十六、服务器管理

十七、知识管理

部分应用客户

协助客户获得奖励

一、面临的挑战

传统的无线、家宽业务从末端接入后到地市核心枢纽落地/调度,网管围绕设备进行监控维护管理。随着业务需求及组网架构的演变, 以及集团对传输集中化管理的(配置和隐患库)要求,以设备视角的监控维护逐渐不适应新的管理要求,缺少集中化管理系统,无法实现端到端业务管理、 不利于差异化维护能力实现及不能快速响应业务保障支撑。

4G业务承载不同于传统2/3G,由省内干线+城域网传输网共同实现移动基站回传业务。而省内干线和城域网传输网通常不是一套网管,维护管理分散,故障定位慢

家宽业务随着IPTV、大视频等直播业务兴起,数据网BRAS、内容CDN等不断下沉,业务落地从城域核心枢纽逐渐下沉至县级汇聚,需要调整相适应的维护保障要求

双跨集客专线是通过传输设备最多的业务,涉及由不同传输网管共同监控维护,其业务保障重点往往在接入末端,需提供差异化的故障监控及维护作业,实现有效支撑

二、战略重点及解决思路

战略重点:通过实现传输运维统一门户,以业务支撑、运行维护、网络优化及规划审核等四大运维场景驱动完善自动化、智能化IT手段,实现“一站式” 维护体验。 重点在业务端到端分析、智能巡检、性能分析、隐患管理、智能割接、配置合规等方面,全面提升传输运维智能化水平。

1、通过数据中台实现统一数据定义、统一数据模型、统一数据共享,构建融通共享的数据中台;

2、通过业务中台实现统一服务封装、统一服务目录、统一能力开发,构建融通编排的业务中台。

解决思路:建设以业务配置管理(管理资源和资源间的关系)为核心的传输集中化运维管理平台,探索资源数据关联分析模型、 业务影响算法,实现作业计划、隐患库、 割接备案管理等,弥补当前短板,提升运维效率。

1、通过集成综合资管、PTN厂家OMC的资源数据,建立资源关联算法,实现端到端的业务拓扑资源呈现、同路由分析、故障定位;

2、通过集成集中故障故障平台的告警数据,实现告警关联,业务影响分析;

3、通过集成集中性能平台的流量数据,实现PTN网络流量拥塞预警、协助故障定位;

4、通过和EOMS系统集成,实现故障分析结果的自动派单。

三、整体方案

传输综合运维不是保持原有分散工作方式的物理集中,而是通过IT手段再造现有运维生产流程,围绕综合运维平台, 形成以业务服务驱动运维管理的新模式,实现运维管理“降本增效”。

四、个人工作台

建立个人工作台任务管理视图,实现任务工单指派、优化闭环管理。

五、重要业务路由单点预警及影响分析

实现VIP基站、重保OLT、重要集客专线业务路由完整还原,当发生路由单点故障进行预警,通知一线提升故障响应级别,缩短故障恢复时长,最大程度避免前后两点故障导致业务中断,落实重要业务差异化维护要求。

实现环网开环后直观展示开环的故障拓扑、关联分析故障影响范围、数量及级别,便于监控快速调度现场处理

六、OTN业务配置合规性自动核查

在家宽业务主视图上绑定网元和端口告警,在OTN信号流图上绑定OTN板卡和端口告警,实现对主备用路由是否共路径排查,也方便对业务路由出现的告警做根源分析。

OTN承载家宽业务时端到端业务拓扑视图

OTN业务配置路径信号流视图呈现

七、CMDB:4G和家宽业务端到端监测分析

对于业务经过网元及隧道端到端路径的多种故障内容进行故障影响严重性进行排序,通过智能汇总分析,得出引起业务故障的根本原因, 作为故障定位的结论;3-5分钟完成的故障定位分析; 同一时刻基站退服≥5个数量,大面积告警分析实现5-10分钟实现分析结果,并实现重大故障EOMS的工单推送。

八、告警管理

平台对来源于集中故障平台的不同专业告警信息进行统一管理,并进行告警压缩(压缩标准:20分钟相同 网元及标题的进行压缩),每天处理的告警量达500万条以上。

1、告警列表:列出告警详细数据,并可进行手动批量确认和关闭告警。识别配置源:通过相关属性值识别CMDB中的CI项进行告警绑定。

2、告警详情:列出单条告警详细数据,可进行确认和关闭告警。并列出单条告警详细抖动情况,表示在时间段内,同一故障点的多次出现的告警情况。

九、配置自动化管理(PTN 网络)

联动厂家OMC、EOMS工单系统,对全网局数据进行合规性审计,审计结果自动派发,作为网络整改的依据,常态化、智能化的合规审计,保障传输网络在最佳健康度下运行。

十、性能管理分析

通过性能流量管理模块对传输资源与性能数据采集。实现性能和流量越限、预警转隐患与挂牌管理。为传输网络性能分析提供可视化管理能力。

十一、作业计划管理

传统维护作业由维护人员定期通过OMC手工采集告警、性能及配置数据进行对比分析,耗时费力且存在作业执行不严格、隐患发现不及时、问题处理不彻底等现象。通过研发自动维护作业IT手段,可针对网管侧维护作业项目定义检查内容及合规标准模板,通过关联电子运维工单、集中故障、集中性能等系统,自动采集数据分析替代传统人工操作,使维护人员聚焦于作业异常结果的快速处理,有效提升预防性维护价值。

自动发现有助于确保,整个数据中心之中支持应用程序的CI数据准确性,这也是我们进行 ITOM 和 ITSM 的基本要素

ZY Discovery,可以发现分散在整个数据中心之中的 IT 资源信息,包括服务器、存储设备、网络设备、数据库、中间件的配置信息, 帮助管理人员了解这些组件的配置信息及相互之间的依赖关系

十二、隐患管理

建立传输网络隐患库,以源头控制、存量整治及应用提升为管控抓手,制定隐患长效解决机制,持续开展网络隐患整治,深化传输集中运维体制改革,有效提升网络业务承载性能。 传输网络隐患全过程集中管控的关键环节包含隐患入库、审批、派单、隐患处理、隐患质检归档等,并根据不同的维度输出各种统计报表。

1、隐患管理:多维度隐患管理——传输配套隐患、设备及网管隐患、组网安全隐患、性能隐患、数据配置隐患、机房动力隐患;多层面隐患管理——故障处理、资源管理、项目管理、集中分析、厂家维保。

2、隐患评估:传输设备自动化评估:将传输设备的性能、流量、网络结构、网络告警、等信息通过自动化方式进入隐患库管理流程,并进行隐患的评估管理。非设备类人工评估:以传输外线资源以及传输专业的其他隐患通过流程进行管控评估。

3、隐患整改:通过隐患库处理流程或EOMS派单到各地市运维人员或厂家进行隐患整改。

十三、割接备案(变更管理流程)—业务割接风险评估

通过割接备案管理系统,定义割接分类、状态、申请审批路径,进行割接方案制作时,流程可以选取涉及割接的配置项(Configuration Item

CI), 查看CI涉及的相关业务。可以手动改变CI的状态为故障,展现哪些业务受影响,为变更割接的风险评估提供图形化依据。

十四、应急资源调度

实现重大问题技术支撑、紧急扩容资源调度、应急场景保障响应。同时实现对资源的新增、导入、修改、删除等资源调度管理功能

十五、故障管理—业务影响PING测验证

系统自动分析出业务受影响时,可以在业务影响视图定位故障;业务视图上可判断是否路由条目是否有告警变化,是哪些路由出现了变化; 根据故障点即时告警情况也可进一步通过视图网元节点发起相关业务ping测功能进行业务验证。

十六、服务器管理

内容资源可视、质量精细化分析、故障分析与定位与业务调度联动

1、通过日志采集,实现质量监测:通过日志采集引擎实时采集不同厂商的缓存日志,梳理缓存业务的管理指标体系,通过监测指标的数据,衡量业务的质量,实现主动性质量监测

2、实现故障的分析和定位:通过对异常数据指标的呈现,以及使用指标关联分析的方法,帮助维护人员及时发现并进行原因分析,实现故障的分析和定位

3、实现业务调度联动:通过对缓存系统、DNS系统的对接,基于合理的调度 规则,实现业务配置的联动,最终解决问题

十七、知识管理

文章所有权管理、文章版本管理、自定义搜索、上下文搜索、知识流程配置、场景化关联知识文章

1、通过解决或转移案例来提高生产力,并结合新知识来解决业务问题

2、通过记录答案为客户和员工提供一致、已验证的解决方案,提高用户满意度

3、促进知识共享,鼓励全公司知识众包,消除信息差距

部分应用客户

 贵州移动

协助客户获得奖励

2014年,“面向LTE的PTN网局数据配置智能核查服务 ”获得移动集团一类科技成果奖

咨       询                                申请试用