不一样的"人" 不一样的IT运维

“人”在IT运维管理中的作用是无比强大的,同时,人又是串起工具与流程的纽带。随着企业IT系统的不断扩大,不同职责的人在这条价值链中的视角也会出现不同的聚焦。那么,在企业成长目标不断攀升的过程中,如何利用IT运维管理平台支撑起IT运维工程师、IT部门经理、企业决策者,并为他们提供最有价值的信息,解决麻烦呢?

说起IT运维,不同的人有不同的理解,有的人认为IT运维就是修电脑、看机房的;有些人认为IT运维是负责公司服务器管理、网络维护的;更专业些的认为IT运维是负责应用系统维护、保证应用系统安全可靠运行的。这些说法都有其正确的一面,也都不全面。不同的场景下IT运维涉及的内容不同,工作职责范围也不同。

本书共分为5篇,机遇篇、做事篇、处事篇、技能篇和高级篇,从不同的层面阐述了IT运维人员
应掌握的方法及相关知识与技能。本书作者深入浅出、化繁为简,将信息化服务中晦涩的IT标准规范、流程体系用浅显易懂的方式娓娓道来。在“机遇篇”中,通
过实际案例分析,帮助读者选择职业定位,使长期受到选择从事“软件开发”还是投身于“IT服务”问题困惑的从业人员得到明确的指引。在“做事篇”中,针对
IT服务做什么、怎么做、怎么做好等问题进行了阐述,为从业人员整天陷于事无巨细的IT服务工作梳理了工作思路,理清了工作目标和方向。在“处事篇”中将
IT服务人员从与机器和代码打交道中解脱出来,认真思考和把握如何与用户进行有效的沟通和交流,将“做事先做人,有位必有为”的服务理念分享给读者。在
“技能篇”中系统地介绍了运维服务所涉及的各种IT技术和技能。在“高级篇”中向读者深入浅出地介绍了当今国内外先进的IT服务标准、架构、体系和方法。
希望本书的有关内容能够成为IT从业者或即将从事IT运维服务者的指引,为成功遨游于IT运维服务领域奠定基础。

 
IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分,该阶段主要用于IT部门内部日常运营管理。
 
涉及的对象分成两大部分,即IT业务系统和运维人员,该阶段的管理内容又可细分为七个子系统:
设备管理:对网络设备、服务器备、操作系统运行状况进行监控
应用/服务管理:对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理
数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复
业务管理:包含对企业自身核心业务系统运行情况的监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical
Success Factors)和KPI(关键绩效指标Key Performance Indicators)
目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理
资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互
信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,36个控制目标和127中控制方式,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等
日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段IT运行维护管理的每一个子系统中都包含着十分丰富的内容,实现完善的IT运维管理是企业提高经营水平和服务水平的关键。运行/维护阶段与服务/支持阶段的分界线为前者是面向IT部门内部的管理,而后者是面向业务部门、企业中的其它人员或直接面向客户。

伴随云计算、大数据等热门技术的发展和普及,企业对IT运维的重视程度在逐年提升。最初,为保证IT系统的正常运维,大多数企业被动地进行故障排除以及软硬件的维护。而如今,越来越多的企业主动的进行IT运营维护服务,对系统进行运营管理,未雨绸缪,防患于未然。

企业规模不断扩大三大核心人物关注IT运维

IT运维简单点说就是负责IT系统的运行维护工作,保障系统安全稳定运行,给用户提供有效的IT服务。IT系统范围很广,包括每个企业都用到的OA系统,我们邮件、考勤、差旅报销全靠它;还有企业内部的进销存、客户关系管理、物流管理、计费管理系统等等。有的系统是辅助我们日常工作,有的系统直接就是我们的生产系统,系统如果停止服务就只能关门下班了,这种场景下保障IT系统稳定运行的运维部门就显得尤为重要。

作译者

李鹏,北京中烟信息技术有限公司,中国信息技术服务标准技术委员会专家,IT运维实验室行业专家,ISO20000国际认证管理师,从事IT安全及运维管
理工作近二十年。近年致力于提升中国本土企业IT治理水平,坚持倡导运用国际先进的IT服务管理理念,结合企业实际开展IT系统的安全及运维管理。

一、IT运维的现状

一般情况下,IT运维管理的需求是随着企业规模与成长速度逐步调整形成的,从技术与管理两个维度来分析,企业IT运维管理一般可分为:IT基础设施管理阶段、综合业务管理阶段、全域集中管理阶段。在这三个不同的阶段,企业从小到大,IT系统从简到难,关注IT运维管理的人员也会由少变多,由低到高。从单兵作战维护终端与网络的管理员,到需要与业务部门配套的IT运维团队领导者,再到以CIO为代表的高层决策分析人员,最终在IT运维管理中形成同时存在的三大核心人物。而由于这些人在企业所扮演的角色和承担的责任不同,对于IT运维管理的关注点也是不同的。

根据企业规模和用户分类来看,IT运维的工作职责、能力要求也有很大的区别。

目录

机遇篇
第1章 奇葩的IT男 3
1.1 半年月薪过万 3
1.2 三年当部门经理 4
1.3 IT服务的创意人生 4
第2章 机遇就是选择大于努力 5
2.1 IT开发还是IT服务 5
2.2 早选择,早领跑 6
做事篇
第3章 IT运维做什么 11
3.1 IT运维的四件要事 11
3.2 IT运维服务的原则 13
3.3 掌握服务平衡 19
3.4 落实整体运维 23
3.5 贯穿始终的服务流程 24
第4章 有目的、有计划地做事 27
4.1 怎样找目标 29
4.2 怎样做计划 29
4.3 怎样按计划去做 34
第5章 注重规范性和完整性 39
5.1 做事的规范性 39
5.2 做事的完整性 45
第6章 高效率和高质量 47
6.1 什么是高效率服务 47
6.2 怎样做到高效率 48
6.3 什么是高质量的服务 51
6.4 怎样做到高质量服务 52
第7章 亲和性和系统性 53
7.1 什么是亲和性 53
7.2 怎样做到具备亲和性 54
7.3 系统性 54
第8章 懂业务和善思考 57
8.1 懂业务 57
8.2 善思考 57
第9章 其他服务 59
9.1 咨询服务 59
9.2 培训服务 60
9.3 数据整理与分析服务 61
9.4 其他拓展服务 61
9.5 服务的实施 62
处事篇
第10章 赢得客户的心 练好外功 65
10.1 解读用户心经 65
10.2 匹配用户需求 69
10.3 沟通从心开始 72
10.4 满意从体验中来 77
第11章 赢得自己人的心 修炼内功 79
11.1 怎样与上级保持一致 79
11.2 怎样与同事有效合作 80
技能篇
第12章 运维硬功夫——运维硬件
技术介绍 85
12.1 服务器 85
12.2 存储设备 92
12.3 网络设备 105
12.4 硬件运维技能攻略 112
第13章 运维软功夫——运维软件
技术介绍 115
13.1 操作系统 115
13.2 中间件软件 125
13.3 数据库 135
13.4 数据备份软件 152
13.5 安全软件 161
13.6 双机软件 164
高级篇
第14章 精准运维服务 179
14.1 精准运维的由来 179
14.2 精准运维的定义 180
14.3 精准运维的方法 180
第15章 用户感知体系 185
15.1 什么是用户感知 185
15.2 用户感知原理 186
15.3 用户感知体系的建立 187
15.4 感知的方法 188
第16章 IT服务的治理 191
16.1 理想与困惑 191
16.2 IT服务治理的目的 192
16.3 IT服务治理的原理 192
16.4 IT治理实例 195
第17章 天外有天:IT服务的
国际标准 197
17.1 ITIL 197
17.2 PDCA戴明环 202
17.3 ITSM 204
17.4 ISO 20000体系 205
17.5 ISO 27001 207
17.6 ITSS运行维护标准 209
17.7 创新是王道 210
结束语 213
附录 215
参考文献 216

目前,IT运维工具市场鱼龙混杂,企业数据碎片化,而且IT架构日趋复杂化。从IT运维体系角度讲,一般中小型企业IT架构并不完善,在基础设施配置方面是存在缺陷的。而且对于中小型企业来讲,IT运维人员的发展空间较小,运维人才流失比较严重。从用户角度来讲,市场竞争激烈,用户的对产品的要求越来越高,产品的精细化程度越来越强。

以一个具备分支机构的大型企业出现IT故障为例,由于上面三种不同层次的管理者职能范围不同,看待这个IT故障的角度也会不同:一线的IT运维人员担心无法第一时间得到故障通知,并且在陷入被动局面之后,定位故障源头的难题让这种局面恶化;如果说网管员的压力只是纵向的,那么夹在中间的IT经理则会承担全方位的压力,有CIO从上到下的命令、也有横向业务部门的催促,当然,他们会更关心这个故障可能影响的业务范围或者寻找可以替代的解决方案;通常在外人眼里,IT故障在决策层显得并不重要,但这完全要看这个企业的关键业务是否是建立在网络的基础之上,如果出现“苏格兰皇家银行因为IT故障赔偿数亿英镑”的事件,CIO是承担不起的。因此,决策层希望看到的不是故障或者IT运行状况的表象,而是更广、更深的数据,即战略依据。

公司规模.png

总结来看,目前企业的IT运维管理大致可以分为三个阶段,IT基础设施管理阶段、综合业务管理阶段以及全域集中管理阶段。

作为国内领先的IT运维管理专家,北塔软件认为:“经过多年信息化建设和数据积累,企业IT逐渐进入大集中时代,‘小前端、大后台’让IT运维管理变得越来越重要。IT后台的庞大和复杂性不但让IT系统出现故障之后的判断和恢复时间更加紧迫,也可能牵一发而动全身。因此,企业首先要结合自身所处的IT运维管理阶段为对应的人提供支持,并能结合企业成长的步伐,实施与之相辅相成的IT管理方法。其次,也要具备战略眼光,最终为这三大核心人物提供全局管理的平台。”

运维技能的对照说明:

图片 1

不再让“故障牵着走” IT将更有能力实现创新

运维技能.png

二、IT运营:IT运维升级版

不论企业的IT运维管理处在哪个阶段,如果IT人员为层出不穷的故障忙于奔波,日复一日地排查故障、配置机器,那么这便会让企业无法相信IT具有的创新能力。或者,IT部门根本没多少时间用来研究策略、做长远打算,而这些对于IT创新都是不可或缺的。因此,在越早的阶段解决IT故障管理的麻烦,越往后就越具有创新能力的储备,这对保持企业的业务创新同样具有意义。

1、传统企业

从定义上来讲,IT运维是指企业IT部门采用技术手段对IT系统,包括硬运行环境(软件环境、网络环境等)、IT业务系统和IT运维人员进行的综合管理。由此可见,IT运维强调的是网络管理,也被称为IT基础架构管理。从本质上讲,IT运维管理是对底层IT基础设施、应用服务和业务服务的综合管理。

在IT基础设施管理阶段,用户可以使用北塔软件的BTNM和BTIM实现对网络系统、网络设备、服务器等的监测和管理,形成主动管理、自动定位故障来源,将一线的IT运维人员解放出来。而后,在综合业务管理阶段可以引入BSM,利用BTIM,以业务为视角,将业务所关联的网络、服务器、基础软件一目了然的规划在业务视图中,使
IT经理和整个部门从关注IT故障管理转变为聚焦整个业务系统的健康性保障上来。而在全域集中管理阶段,用户可以进一步利用北塔BTCM通过对全域IT运维数据进行360度全方位的处理、统计、分析、挖掘,再将最终结果以不一样的界面呈现三大核心人物。北塔BTCM在这里主要是管理范围更大、更能便于数据采集、更能支撑IT决策分析的IT运维平台,也是真正能够将这三大核心人物融为一体的平台。

这个传统企业主要相对于互联网企业而言,服务不是通过在线网上来提供的,更多的是提供线下服务,譬如,传统的超市、电力、石油、制造型企业。这些企业通常只有内部用户,包括内部的办公自动化(OA)、客户关系管理系统(CRM)、企业资源计划系统(ERP)等等。这类企业大部分的IT系统都是购买第三方的。

当下,对IT系统的运营和维护不仅限于网络管理,而是对整个IT系统和业务所涉及的领域进行运营管理,更多的是作为一种商业模式来进行运营的,即IT运营。此前,优锘科技CEO陈傲寒曾断言,企业IT运维的整体发展和变化趋势是从专注稳定和安全的IT运维向注重效率和效益的IT运营模式的转变。

一位IT业著名公司CEO曾经说,如果一把大火烧光了所有的厂房与设备,只要公司的核心团队还在,给他时间,就能再次做出一个同样影响力的公司。当IT运维与业务紧密结合之后,便会让IT释放出空前的潜力,创建出更加高效的组织。而要实现创新,就是要从改变每个人的工作方式开始,从IT运维管理中的三大核心人物开始。

** 小型企业
**(几十人):通常购买现成的甚至于用一些免费的系统,通常是对生产提供辅助性的工具,譬如OA系统,对系统的功能和可靠性要求不高,这种场景下只需要一两个熟悉计算机技术的人兼职即可,不需要专业的运维人员,这就是有些人眼里修电脑、装系统的。这种情况下系统挂了半天也无大碍,对正常生产没有特别的影响,最多有人抱怨一下。

IT运营,即IT运营分析,通过利用大数据和数据挖掘技术,针对IT系统运行过程中产生的海量机器数据进行存储、计算、分析、展现,并将分析结果转化为可付诸实施的解决方案。

运维技能只需要L1级别

从定义分析来看,IT运营则是对基础设施进行监控,对企业数据进行管理,对流量数据进行分析,对嵌码进行监测,同时实现仿真探测。简言之,IT运营是全方位,多角度的对IT系统进行统一架构。

**
中等规模**(几百人以上):这部分企业一般会考虑定制化自己的IT系统,并且会架设自己的服务器或者将服务部署在云环境下,这种情况下通常每年会有IT方面的预算,并且会购买IT厂商的运维服务,但是为了沟通方便和从减少运维成本角度考虑(有的上门服务很贵还不及时),会设置专门的IT运维人员,通常会有几个人的IT小组或者部门。这种情况下一般需要运维人员是个全能选手(技术广度有余、深度不足),包括会装机、会网络管理、会应用部署、会数据库维护
,小毛病能够自己解决。通常是直接影响生产的系统,如果宕机影响就比较大,会影响到正常的商业活动、影响收入,譬如超市的POS机系统宕机,收不了钱,卖保险的系统宕机无法正常给用户办理保险业务。因为事关正常的生产活动,对运维人员的技能和服务意识有较强的要求,对运维流程也有较高要求,不能随意动生产环境。

三、IT运营的发展趋势

运维技能需要达到L2级别及以上

1. 集中化、自动化运营

大型企业(几千人以上):大型企业财大气粗,为了配合企业的形象,会成立相对独立的IT中心,提供高效的IT服务。这种场景下大部分是支撑分公司、门店业务系统的正常运行,非关键业务企业通常会购买定制第三方IT产品,核实业务有的也会自己研发。有专门的运维队伍,分工具体,其中应用维护、主机维护、网络维护、系统优化都有专门分工,对运维的规范有较深入了解,运维流程相对健全。此时IT中心又可以称为业务支撑中心,主要支撑公司的主营业务发展,对公司的市场经营活动起到强有力的支撑作用。这类企业中对OA等办公系统的支撑不是最主要的,并且必要的情况下会引入外包的运维服务。

通过打造集中化、自动化的运营管理平台,对数据进行集中管理,对集成层数据、存储层数据以及应用层数据进行智能分析。集中式的运营有效地解决跨部门信息传递效率低下、信息流失等现象。同时,自动化运营平台还具备标准化、流程化、智能化、模块化和自动化等特点,正是基于这些特点,IT运维也由复杂变得愈发简单,运维人员的工作量也得到了有效的控制。

运维技能需要到达L3、L4级别

2. IT运营管理可视化

2、互联网企业

何谓可视化?简言之,就是将企业海量的数据、IT物理机房、逻辑架构以及业务流程等各类抽象、庞杂的以数据驱动的直观图的形式呈现在人们眼前,实现“数图互换”。通过直观图,按图索骥,在架构图中精准定位,检测信息,排查故障。

互联网企业也有内部用户,但一般不是重点,重点是外部用户,可能数百人的公司就支撑着几百万用户使用的网站系统。在这种情况下公司的内部用户通常信息化能力都比较高,内部OA等投入不会很大,公司的大部分人力都投入到生成系统(在线站点)的开发和维护中去。中小型的互联网企业开发、维护区分不是很明显,大家一起投入保障系统安全稳定运行。大型互联网企业研发、运维会进行分拆,运维重点是保障系统的快速部署、信息安全、系统优化、日常巡检、例行作业维护等。另外这类企业中的运维人员更能接触和拥抱新技术,在运维自动化等方面投入会更多。

这一新变革,避免了IT系统运维人员的离职而造成“信息断层”情况的发生,而且通过这张直观图,企业的管理层底层、决策层甚至是底层员工都能有效认知企业的IT架构,并随时洞悉最新动态,从而高效的完成各类运维工作。

这层面运维技能需要到达L3、L4级别

3. IT运营管理场景化

记者从优锘科技了解到,IT运营管理场景化强调的是对于企业运维工具以及业务数据的整合。目前,企业业务处于快速发展阶段,IT部门的压力陡增,碎片化数据量巨大。通过搭建场景,在场景中一站式整合各种管理要素,包括IT架构图、运维数据、运维工具、处理规则等,模式化、场景化的整合管理,从而实现高效的运营管理。

当然,IT运营管理不可能通过某一套软件产品或工具解决所有的系统运维问题。毕竟,IT运营管理包含了很多不同的领域。未来的IT运营维护将会呈现一种产业链状态,各个企业在各自领域把各自的服务做到最好,形成产业链的上下游关系,从而解决IT运营遇到的各种痛点,从而帮助用户实现新时期的转型与跨越。

需要明确一点,并不是说IT运营产品、软件或者平台就是万能的。陈傲寒告诉记者,运营产品、软件以及平台更多的是针对高频低损事故的发生,而对于低频高损的突发系统障碍还是需要专门的运维人员来进行维护的。

【编辑推荐】

相关文章