运维报告分为日常运维报告和特殊运维报告,日常报告一般有周运维报告、月运维报告、季度运维报告、年度运维报告,也有单位要求到日或半日运维报告,这要根据实际情况而定。需要指出的是,报告太多,也会浪费领导的时间,影响领导的精力,甚至成为一种形式;特殊运维报告有升级、改造报告,故障处理报告,重大事件运维保障报告等,就某一事件、阶段或问题的专项报告。
一、运维报告的意义和价值
部分运维人员,习惯编写运维报告,对自己和单位或用户都是一种负责的态度。认真、准确、按时、严格编写运维报告能起到以下功效:
1、通过编写运维报告,运维人员可以进行阶段性运维工作过程的回顾、运维工作的总结,进行查漏补缺。通过编写报告,可以分享自己的成功经验,也可以再次认识自己的失败原因,避免出现类似错误,促进团队共同提高。
2、通过汇报运维报告,相关领导可以获得某一阶段的运维信息,为他们作出决策提供参考依据和指南。比如,通过报告,领导知道现在运维的状况,是否有设备需要升级,是否有需要改进的环节,需要重视的环节,在同行、同类中所处的位置和级别,是否需要预留资金,等等。
3、通过编写运维报告,为以后工作提供事实依据。比如,报告中多次指明某设备已经过期,需要更换,可是对方因资金等问题迟迟拖延,结果导致故障。事后,如果领导责怪运维人员没有及时提醒,可以通过运维报告为自己证明。尤其运维外包合作,一旦出现问题,都要涉及经费问题。同样,如果运维报告中确实没有报告,那么运维人员要承担相应的责任。
4、运维报告是申请升级改造的依据。运维报告一般不会越级送到一把手手中,即使送到一把手手中,他们也没有时间细看(或者根本看不出问题),只有通过接口部门向上反映和汇报。当需要升级、改造等工程时,一般都是由接口部门向一把手反映、汇报,运维报告就成为他们汇报的依据。比如,问题已经汇报了半年了,再不解决不行了。
5、运维报告反映了最近阶段运维工作的成绩和缺陷,反映各成员的分工合作情况,为运维部门申请运维经费、员工绩效和奖金,提供事实依据。
二、运维报告的内容和格式
1.日常运维报告
编写运维报告,要有一定的格式和顺序,同时要有一定的内容,这样才是有血有肉的有机体。运维报告一般包括:概述;运维的背景情况;本阶段运维工作的核心内容;表明决心。
(1)运维报告概述。
运维报告概述讲述运维的对象,运维工作的范畴、内容、重要性,运维团队,运维的时间和期限,运维指标,报告性质、报告人、报告时间等。
(2)运维背景介绍。
运维背景介绍主要针对上一报告周期内容的回顾,尤其一些遗留问题,升级和改造工程等,以及对它们的建议和采取的实施方案(这些方案和建议,可以来自运维团队,也可以来自运维对象的相关领导,还可以来自于第三方)。有时,也会介绍一些社会环境、技术发展背景、资源支持背景等内容。
(3)运维工作的核心内容。
这一部分是报告的核心部分,编写的方法一般是分门别类,也就是按运维的地域、范围、功能、模块、管理、重要程度等进行划分。比如,运维是跨地区的,可以先按地区划分,然后每个地区再按类别划分;如果在同一地区的,可以按类别划分,类别里再按工种划分;也可以按运维的重要程度划分。运维工作的划分,类似于WBS、RBS、OBS的分解。
在分好类以后,在汇报每项工作的时候,首先,要说明本报告阶段内工作进行情况,取得的成绩,存在的问题,运维建议和意见;然后,对几个相邻报告周期阶段进行对比分析(频率、数量、种类、规模、重要性等方面);最后,对这一项工作进行总结。
依次逐项完成汇报,然后将本报告的重点再进行汇总总结,比如重大成绩、急需解决的问题、重大安全隐患、需要升级改造的内容等。不论以前是否汇报过,只要现在依然存在,就继续汇报。需要提醒的是汇报只针对事情,不针对任何个人或团队(特殊情况除外)。
最后,要对本阶段的运维工作进行总结,突出成绩,体现问题,附带诚实的建议和意见。
(4)下一阶段的计划。
在报告结束时,要对下一个报告阶段作出规划和愿景,即遗留问题的处理方法,日常运维服务水平的提高,团队技能的提高,运维环境的改善,尽力杜绝不该出现的故障等。
2.特殊运维报告
以上介绍了运维报告的一般格式,对于特殊报告将如何编写呢?比如,故障处理报告,系统升级改造工程,设备或设施的更换等。对于这种专项报告,主要是就某一件事情或过程进行报告,它的格式也可以分为四部分,但是侧重点不同:先作专项报告概述,介绍此报告针对什么事件;然后介绍事件发生的背景原因;接下来汇报该事件进展过程及状态变化情况;最后得出结论。
(1)专项报告概述。
这部分主要介绍此专项报告涉及的事件名称,发生和结束时间,发起部门、实施部门、监督管理部门等,事件的影响力等内容。
(2)背景原因。
这部分要介绍事件产生的过程和原因,前期事件的分析过程,实施方案和过程,相关部门的重视度,事件造成的影响、影响程度和蔓延的控制等。此部分尽量提供事件发生时的相关数据、现场鉴定证据(尤其是图片、视频)等。
(3)事件处理进展情况和状态变化。
如果事件按计划顺利处理完成,这部分就可以写得简单点;如果事件的实施过程有变化,要将变化的情况、请示的过程和结果、最后的处理结果等详细报告;如果事件仍然存在,要提出应急方案,以及立项的准备工作等。
(4)总结。
专项报告也要有结论,即经验教训,以便日后参考。
三、运维报告编写注意事项
1.报告内容要完整
有效的运维报告,应该包括:运维工作的范畴、内容、重要性,运维团队,运维的时间和期限,运维指标,报告性质、报告人、报告时间,运维对象等报告概述;报告的背景情况;报告的信息和数据资料,分析对比过程;报告的结论等。
2.报告要以客观事实为依据
编写报告,一定要以客观事实为依据,切忌胡编乱造,否则可能会酿成大错。
某通信公司,因一台流控设备不稳定,导致缺少当月流量数据信息,运维人员害怕领导批评,就对上一年同月的流量进行了篡改处理,并编入了报告,效果很明显。可接下来的一个月,流控彻底罢工了,领导要对日志进行分析研究,结果发现这台设备4个多月前就被黑客控制了。
3.报告要及时准确
曾有这样一个事件,季度运维报告延误了3个月,部门接口领导获知网络入口带宽不能承载业务需求,于是就向一把手申请增加带宽。当他再次接到最近期的季度运维报告时,领导已批准了扩容申请。部门接口领导看完报告后,发现原申请的带宽,已经不能满足现在的需求了。部门领导无奈,只能重新申请。
4.报告要清晰易懂,简明扼要
编写报告时,一定要了解接受者的知识和行业背景,适当使用专业术语可以起到简明扼要的好处,但太“时尚”的专业术语会造成不理解或误解现象。
5.报告具有时效性
报告的时效性,即报告的频率、有效期限都应该与实际需要一致。