联通上海分公司 王春明 候粤蓉 张扬 金昶
中国联通短信业务自2000年后呈几何倍数增长,2003年短信量更是突破了500亿条,仅2004年春节期间联通短信发送量就超过20亿条。短信平台运行是否正常、稳定直接关系到联通用户的切身利益,然而以往对短信平台的监控手段相对匮乏,常常须要手工操作和统计,存在着许多缺点,如:效率低、不直观、不方便等等,严重影响了监控效果。出于为广大用户利益着想和保障短信平台安全的考虑,上海联通增值业务部决定利用现有的接口数据开发短信监控程序,以高效、直观、方便的监控界面对短信平台全面的监控,上海联通首先在C网上实现了短信实时监控系统的第一版本,以下对实现具体过程进行描述。
一、系统简介
1. 短信平台
短消息平台完成移动通信网络中用户短消息的存储转发功能,同时提供外部短消息实体的接入和服务功能,还实现了CDMA网络与GSM网络的短消息互通、小区广播等重要短消息功能,并且提供了多种对外接口,支持增值业务的开发,其结构如图1所示。
图1上海联通短消息平台
其中,业务处理部件是整个系统功能的核心,包括业务服务器和数据库系统。业务处理部件采用TCP/IP协议与信令网关、SMPP网关和操作维护等模块进行通信。在Windows操作系统、SQLServer客户端软件的支持下,可运行多种应用软件,完成MAP信令处理、短消息业务处理、数据存储访问、版本管理和告警管理等功能,实现短消息中心的系统功能。
SMPP网关采用PC服务器的结构。它可以通过SMPP(V3.3)协议与GSM已有的短消息中心相连,通过SMPP(V3.4)或者SMPP(V3.3)协议与CDMA已有的短消息中心相连,实现两网互通。SMPP网关将各类ESME同时与GSM短消息中心和CDMA短消息中心连在一起,实现增值业务的共享。
操作维护部件包括操作维护服务器OMM、计费服务器、业务受理台和操作维护台。业务受理台以一定的权限管理数据库中的用户数据,进行用户增加、删除、业务登记、修改等操作。操作维护台通过应用服务器实现系统的操作与维护,包括:数据配置、业务观察、信令跟踪、性能测量、故障跟踪与定位、系统监测与告警、计费、小区广播控制等。
2. 监控系统
短信监控系统是为加强上海分公司对短信实时监控、帮助值维人员及时发现问题、协助管理人员分析故障原因而开发的监控系统。
监控系统需要对短信平台中业务服务器、信令网关、SMPP网关等进行实时监控,对每一台服务器采集所需数据并分析处理,最终给监控人员提供图形化的监控界面。根据用户的需求实现所需各种数据的图形化显示,能直观地反映历史同期的情况、能进行每日统计、能查询任何一个时间点的相关数据、通信中断时产生告警等。
监控系统力求给监控人员方便快捷的途径去管理监控和维护短信平台。
二、需求分析
1. 数据源的要求
目前衡量短信平台是否工作正常的数据需要有以下几个方面。
(1)短消息中心的CPU、内存占用率;
(2)CDMA->GSM和GSM->CDMA的消息流量;
(3)CDMA->移动和移动->CDMA的消息流量;
(4)BHSM、业务量;
(5)MT成功次数、MT成功率、MO成功次数、MO成功率;
(6)到SCP的业务量;
(7)短消息队列等待数量等。
2. 监控终端的功能需求
为了更有效、更直观地监控短信平台是否工作正常,监控界面要求使用图形化界面,实时自动更新数据,具有以下功能:对各项数据分别产生日图、周图、月图、年图从而能直观地反映历史同期的情况;能对某些数据如:业务量、MT/MO成功率等指标进行每日统计;能查询任何一个时间点的相关数据;通信中断时产生和记录告警并能方便地进行查询等。
3. 其它需求
(1)能够在机房或者办公室等不同地点进行监控;
(2)尽可能地充分利用现有设备和资源;
(3)不能影响短信平台的安全性和稳定性。
三、系统设计
通过需求分析,可以将该监控系统划分为数据采集和终端界面显示两大部分。
1. 数据采集
考虑到监控终端软件可能会在多个不同地方同时采集同一数据从而对短信平台造成不必要的负荷,同时也考虑到应充分利用现有设备,所以决定采用现有的OMM(操作维护系统服务器)统一进行数据采集、监控终端从该服务器获取数据的方式来实现数据的采集。
OMM是现有系统中用于操作维护短信平台的后台服务器,本身就具有一定的数据采集功能。其性能统计模块负责将各业务前台模块中的性能统计代理进程所采集、传送的性能统计数据实时存入性能统计数据库SQLServer中,因此监控终端软件的数据源是基于OMM服务器的。
2. 监控终端软件的设计
根据需求分析,监控终端需要实现以下几个功能模块。
(1)对各项数据分别画出1天内的曲线图,并实时更新数据。
(2)显示相应的日图、周图、月图、年图,并求出相应的最高值、最低值、均值。
(3)查询详细数据按『详细』按钮能显示相应的时间范围内的详细记录。
(4)根据用户选择的日期范围对每日的主要指标进行统计。
(5)当无法链接统计服务器OMM或者其数据库时将产生告警,并在主窗口底部显示。
四、结束语
经过实际一段时间的运行,本短信实时监控系统运行稳定,监控、管理、维护方便,极大地缩短了障碍的发现和处理历时,同时还便于分析问题、解决问题,将短信平台故障隐患灭于萌芽状态,保障平台设备更加稳定、可靠地运行。
本实时监控系统功能完善、操作方便、安全稳定,上报的数据真实可靠,符合联通提高运行维护信息化的要求,满足维护规程关于系统监控、障碍处理的要求,对日常维护工作以及远程监控的有极大的帮助,同时提高了值维人员的工作效率。
----《通信世界》
|