[19]中华人民共和国国家知识产权局
[12]发明专利申请公布说明书
[21]申请号200910105245.X
[51]Int.CI.
H04L 12/24 (2006.01)H04L 12/26 (2006.01)
[43]公开日2009年7月8日[22]申请日2009.01.22[21]申请号200910105245.X
[71]申请人中兴通讯股份有限公司
地址518057广东省深圳市南山区高新技术产业
园科技南路中兴通讯大厦法务部[72]发明人张立超
[11]公开号CN 101478440A
[74]专利代理机构深圳市永杰专利商标事务所
代理人曹建军
权利要求书 3 页 说明书 7 页 附图 2 页
[54]发明名称
一种故障信息可追溯的系统及方法
[57]摘要
本发明涉及一种故障信息可追溯的系统和方法,所述系统包括网络管理单元、主控单元以及底层设备,所述网络管理单元包括使能模块、日志显示模块、数据库模块以及筛选模块;所述方法为:使能模块将使能命令通过主控单元发送给底层设备;底层设备收到命令后,若板卡有故障产生/消除,则将故障信息通过主控单元上报给日志显示模块,所述日志显示模块显示故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给筛选模块;筛选模块查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中。本发明可对故障信息进行准确、清楚的说明,方便使用者和定位故障人员掌握故障产生的原因。
200910105245.X
权 利 要 求 书
第1/3页
1、一种故障信息可追溯的系统,所述系统包括网络管理单元、主控单元以及底层设备,其特征在于,
所述网络管理单元用于通过主控单元以命令形式启动底层设备故障自动上报功能、对上报的故障信息进行显示、保存、筛选以及删除;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
2、如权利要求1所述的一种故障信息可追溯的系统,其特征在于,所述网络管理单元包括使能模块、日志显示模块、数据库模块以及筛选模块;
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息;
所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中;
所述筛选模块用于根据筛选算法在单向业务链上查找故障的源头,并将结果保存到数据库中的相应板卡的日志中。
3、如权利要求2所述的一种故障信息可追溯的系统,其特征在于,所述使能模块为一个开关。
4、一种故障信息可追溯的方法,其特征在于,所述方法包括: 步骤一:使能模块使能,将使能命令通过主控单元发送给底层设备;
步骤二:底层设备收到所述命令后,若板卡有故障产生/消除,
2
200910105245.X权 利 要 求 书 第2/3页
则将故障信息通过主控单元上报给网络管理单元的日志显示模块,所述日志显示模块以日志形式显示所述故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给网络管理单元的筛选模块;
步骤三:所述筛选模块以收到的板卡号对应的板卡为参考点,根据筛选算法查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中。
5、如权利要求4所述的故障信息可追溯的方法,其特征在于,所述步骤二中,若所述故障信息日志在设定时间内未被查看,则将所述日志保存到网络管理单元的数据库中,并在网络管理单元界面中产生故障的板卡上设置标记,所述标记链接于所述保存到数据库中的相应的日志。
6、如权利要求4所述的故障信息可追溯的方法,其特征在于,步骤三还包括:在网络管理单元界面中的故障源头板卡上设置标志,所述标志与数据库中对应板卡的故障信息日志链接。
7、如权利要求5所述的故障信息可追溯的方法,其特征在于,所述被保存到数据库中的故障信息日志在设定时间后将被删除。 8、如权利要求4所述的故障信息可追溯的方法,其特征在于,所述故障信息日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间。
9、如权利要求8所述的故障信息可追溯的方法,其特征在于,所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
3
200910105245.X权 利 要 求 书 第3/3页
10、如权利要求4所述的故障信息可追溯的方法,其特征在于,所述步骤三中,所述筛选模块通过如下方法查找故障的源头: 步骤a:判断所述参考点板卡前是否有板卡,若有,则执行步骤b;否则,执行步骤c;
步骤b:查看所述参考点板卡的前一个板卡是否有故障,若是,则继续向前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤c;
步骤c:判定本板卡是故障的源头。
4
200910105245.X
说 明 书
第1/7页
一种故障信息可追溯的系统及方法
技术领域
本发明涉及通信领域,尤其涉及一种故障信息可追溯的系统和方法。背景技术
各类通信设备在工程现场使用中,都可能会出现一些莫名其妙的问题,包括设备一些潜藏很深的BUG,导致设备不能正常使用。 这时就要由设备供应商的用服人员来对设备进行基本的维修,大的问题对于用服人员来说是很难处理的,所以对于故障信息的追溯在此时就比较关键了,因为设备的开发部门要根据用服人员反馈的故障信息来定位故障的原因。
当前的故障信息追溯方法是查看网管历史信息,对于光传输网络管理系统,历史信息主要看历史告警、历史性能和历史事件。而在实际工程应用中,网元、底层设备的板卡的数量非常庞大,每天所采集的数据也是数十万甚至更多。而随着工程应用的网络不断地扩大,对网管历史数据的管理也提出了一个严峻的挑战。
因此,需要一种简单而又高效的方法来追溯故障信息,这样用服人员就可以快速的定位到问题的根源,也使设备研发人员更清晰的知道现场问题的原因。目前对于历史信息的查询都是通过对历史时间点的查询,网管会列出这个时间点附近的所有历史信息。目前追溯方法和系统的缺陷是:
1、只能将所需关注的历史信息按照时间逐条列出,而不能对其进行宏观地统计汇总或分析,以致无法清楚的解析具体故障信息。 2、没有检查历史数据是否齐全,对丢失的历史数据记录无法统计,这样对于当前时间故障如果没有统计上来,对追溯故障信息就会非常麻烦。
3、对底层设备里多个板卡的历史信息没有区分,列表里一并列出,解析数据较麻烦。
5
200910105245.X说 明 书 第2/7页
4、对历史告警、性能、事件分开查询,数据量庞大,对于某个板卡的各个信息统计较麻烦。发明内容
本发明要解决的技术问题是,提供一种故障信息可追溯的系统,并在所述系统的基础上提供一种故障信息可追溯的方法,本发明可对故障信息进行准确、清楚的说明,方便使用者和定位故障人员掌握故障产生的原因。
一种故障信息可追溯的系统,所述系统包括网络管理单元、主控单元以及底层设备,
所述网络管理单元用于通过主控单元以命令形式启动底层设备故障自动上报功能、对上报的故障信息进行显示、保存、筛选以及删除;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
所述网络管理单元包括使能模块、日志显示模块、数据库模块以及筛选模块;
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息;
所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中;
所述筛选模块用于根据筛选算法在单向业务链上查找故障的源头,并将结果保存到数据库中的相应板卡的日志中。 所述使能模块为一个开关。
一种故障信息可追溯的方法,所述方法包括:
步骤一:使能模块使能,将使能命令通过主控单元发送给底层设
6
200910105245.X说 明 书 第3/7页
备;
步骤二:底层设备收到所述命令后,若板卡有故障产生/消除,则将故障信息通过主控单元上报给网络管理单元的日志显示模块,所述日志显示模块以日志形式显示所述故障信息,并在所述故障信息是故障产生信息时将产生故障的板卡号上报给网络管理单元的筛选模块;
步骤三:所述筛选模块以收到的板卡号对应的板卡为参考点,根据筛选算法查找本次故障的源头,并将查找到的结果保存到数据库对应板卡的日志中。
所述步骤二中,若所述故障信息日志在设定时间内未被查看,则将所述日志保存到网络管理单元的数据库中,并在网络管理单元界面中产生故障的板卡上设置标记,所述标记链接于所述保存到数据库中的相应的日志,点击所述标记即可查看相应的日志。
步骤三还包括:在网络管理单元界面中的故障源头板卡上设置标志,所述标志与数据库中对应板卡的故障信息日志链接,点击所述标志即可查看相应的日志。
所述被保存到数据库中的故障信息日志在设定时间后将被删除。 所述故障信息日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间。
所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
所述步骤三中,所述筛选模块通过如下方法查找故障的源头: 步骤a:判断所述参考点板卡前是否有板卡,若有,则执行步骤b;否则,执行步骤c;
步骤b:查看所述参考点板卡的前一个板卡是否有故障,若是,则继续判断向前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤c;
7
200910105245.X说 明 书 第4/7页
步骤c:判定本板卡是故障的源头。
采用本发明,可以使通信设备生产厂家很容易的定位到设备当前故障的源头,通过在底层设备出现故障/故障消除时自动上报故障信息的方式,使使用人员很明了的知道是哪些板卡出现了问题,哪些板卡是问题的源头;使设备供应商的维护人员也更加方便的定位故障的原因,并反馈给设备的研发人员,省去查询和判断大量历史信息的麻烦,直接可以查看具体板卡的故障信息;在故障发生/消除时即上报故障信息并通过日志很清楚的显示每个信息的内容,节省了分类查询告警、性能、事件等故障信息的时间。附图说明
图1本发明所述系统的原理框图; 图2本发明所述方法的实施例的流程图; 图3本发明所述故障信息日志示意图。 具体实施方式
以下结合附图对本发明做进一步详细介绍。
如图1所示,是本发明所述系统的原理框图,包括网络管理单元、主控单元和底层设备,所述网络管理单元还包括使能模块、日志显示模块、数据库模块以及筛选模块。
所述使能模块用于以命令的形式控制底层设备是主动上报故障信息还是被动上报故障信息;所述使能模块为一个开关,用户使能所述使能模块,即接通开关后,本发明所述系统进入故障信息主动上报模式,即启动本发明所述的工作流程;若所述使能模块未被使能,则底层设备被动上报故障信息,即有查询才上报,否则均不上报,此时本发明与现有技术相同;
所述日志显示模块用于以日志形式显示底层设备的故障信息,并在所述故障信息为故障产生信息时将产生该故障的板卡号上报给所述筛选模块;且在设定时间后日志未被查看的情况下将所述日志保存到所述数据库模块中;
所述筛选模块用于根据筛选算法在单向业务链上查找故障的源
8
200910105245.X说 明 书 第5/7页
头,并结果保存到数据库中相应板卡的日志中;
所述主控单元用于转发所述网络管理单元下发的命令给底层设备以及接收底层设备上报的故障信息并将所述故障信息转发给网络管理单元;
所述底层设备用于在其板卡出现故障/故障消失时自动上报故障信息给所述主控单元。
上述网络管理单元与主控单元的通信总线之间需要事先设定好上报故障信息和下发命令的报文格式,主控单元与底层设备之间也需要事先设定好响应命令及上报故障的报文格式。
如图2所示,是本发明所述方法实施例的流程图,具体步骤如下: 步骤201:开启使能开关,将使能命令通过主控单元发送给底层设备,本发明所述系统进入故障信息主动上报模式;
开启使能开关后,勿需人工操作,底层设备在故障产生/消除时会主动上报故障相关信息,方便操作人员在长时间不在现场时,也可追溯到故障的详细信息;而所述开关不使能时,只有手动下发查询命令时,底层设备才会上报信息。
步骤202:当底层设备的板卡有故障产生/消除时,通过主控单元将故障信息主动上报日志显示模块;
步骤203:所述日志显示模块以日志形式显示收到的故障信息; 如图3所示,是本发明的故障信息日志示意图,所述日志包括:告警信息、异常性能信息、异常事件信息和上一次故障发生和或消除的时间;所述告警信息为紧急告警,包括紧急告警的名称、产生的端口、产生关联的性能量、性能值以及产生/消失时间;所述异常性能信息为异常的性能量,包括异常性能量的名称、性能值、异常性能的端口号以及设定时间段前该性能量的性能值;所述异常事件信息包括异常事件产生/消除时间。
对于监控类板卡,主要关注的是异常事件的产生/消失,因为对于它们最大的故障就是复位和通信连接不上等等;对于其他板卡,则主要关注的是紧急告警和异常的性能。
步骤204日志显示模块判断接收到的故障信息是否为故障产生信息,若是,则执行步骤205;否则,不上报,执行步骤206;
9
200910105245.X说 明 书 第6/7页
步骤205:将产生故障的板卡号上报给筛选模块,同时执行206和210;
步骤206:日志显示模块判断设定时间—2分钟是否到达,若是,则执行步骤207;否则,执行步骤208;
步骤207:日志显示模块判断是否有人查看当前日志,若是,则执行步骤209;否则,执行步骤208;
步骤208:日志显示模块判断是否有新的故障信息上报,若有,则执行步骤203;否则,执行步骤206;
步骤209:将所述当前日志保存到网络管理单元的数据库中,并在网络管理单元界面产生故障的板卡上设置标记,同时将所述标记链接到所述数据库中相应的日志;所述被保存到数据库中的故障信息日志在设定时间(比如2天)后将被删除;
比如,设定时间为2分钟,则在2分钟后依然无人查看时自动将日志存到数据库中,以便在后一个日志覆盖掉前一个日志时,可以查询前一个故障信息;当使用人需要查看时,只要用鼠标点触相应的标记即可弹出所需日志,对故障信息的追溯很方便;由于数据库空间有限,所以会在2天后删除所述日志。
步骤210:筛选模块以收到的板卡号对应的板卡为参考点,根据筛选算法查找本次故障的源头,并将筛选出的结果保存到数据库中对应板卡的日志里,同时在网络管理单元界面对应的板卡上设置标志,将所述标志链接到所述数据库中相应的日志,故障信息追溯结束。 筛选模块通过如下方法查找故障的源头:
步骤(1):判断参考点板卡前是否有板卡,若有,则执行步骤(2);否则,执行步骤(3);
步骤(2):查看参考点板卡的前一个板卡是否有故障,若是,则继续往前查看前一个板卡是否有故障,直到前一个板卡没有故障为止,则判定没有故障的板卡的后一个有故障的板卡为故障的源头;否则,执行步骤(3);
步骤(3):判定本板卡是故障的源头。
筛选模块在使能开关开启后,自动以上述方法对故障信息进行筛选,筛选出来的信息会自动记录到故障源头板卡的日志里,并会在故
10
200910105245.X说 明 书 第7/7页
障源头板卡上设置一个故障源头的小标志,方便使用人在使用时可直接追溯到故障信息。
本说明书所附实施例是体现本发明构思的一种典型方式,并不排除使用体现本发明设计方案的其他实施例。
11
200910105245.X
说 明 书 附 图
第1/2页
图1
12
200910105245.X说 明 书 附 图 第2/2页
图2
图3
13