如何正确拟定管理的技术任务:我们的耙子

总的来说,这个话题是取之不尽的。莫名其妙的Lyoshka(我们的工程师)正忙于增加数据责任的数据中心的机架中,那里有几家银行。在下一行中,他观察到一张完全荒诞的照片:那家伙走近了刀片。他取出硬盘,写下一些东西,推回去,取出第二块,写下来,放上,取出第三块。 Lesha对他说:“ Psss,伙计,你在做什么?”他:“好,库存是一样的!”一切立刻变得清晰起来。



我在CROC的计算系统部门工作,我们支持一切可能碰壁的事情。即,数据中心中的服务器,数据存储系统和其他昂贵的硬件。好吧,事实是它具有操作系统,基本的基础结构。最简单的基本服务是备件,即按时更换组件。更为复杂的系统正在取代客户的系统管理员。



合同最可怕的时刻是职责范围的起草。我将告诉您有关我们与客户的共同经历以及如何避免他们的经历。好吧,我将附上我们使用的TK模板的示例。



图片



提高统计



所有技术规格中的第一个门槛是对您平均每月申请数量的普遍了解。看起来像这样:您想将管理外包,然后您需要了解它会花费多少。如果您仅附上设备园区的描述,那么作为比赛的参加者,我们将估算工作范围,参观(如果需要),并提供一定的利润。但是,如果您确切知道去年有多少张门票,那么价格可能会急剧下降-毕竟,您实际上可以看到发生了什么,如何崩溃以及对基础架构进行更改的频率。例如,某人每天添加虚拟机,而某人每年添加一次-价格大致相同。



客户的任务通常看起来像“现在为我们管理一切”。那是什么服务提供商(对我们而言)不了解交易量,一切都重新计入了人工成本。如果我们兑现,您将多付。如果在合同过程中价格突然上涨,就会出现冲突。如果突然发生了某些事情,而我们所收取的合同价格却比实际价格便宜,那么我们将尝试拒绝,最终我们将不得不再次寻找承包商。



有时会发生客户根本不了解其基础架构的情况(例如,在兼并收购或过去的管理员突然离职之后)。只是如果它是一个分支,并且他们很长时间没有在那里查看过。在这种情况下,您需要从头开始进行审核。当然,审计本身要花钱,但是在后续的合同中可以节省很多钱。如果要按每个服务单位的价格比较供应商,则可以在竞争中显示审核结果。毕竟,我们会思考如何:需要付出一定的代价(维修,离职),需要了解有多少种设备。然后我们来看:这样的设备每个月会有如此多的故障,我们将花很多时间在上面。好吧,还是拿一个备份系统。在这里,某人只需配置一次,仅检查所有备份都通过就足够了。有人无休止地更改政策,添加,删除,再次添加。自90年代以来,我们一直在进行管理,并且一直在收集统计信息,因此我们可以非常准确地进行预测。而且,当“有这么多无法理解的服务器,一些虚拟机,难以理解的OS以及那里的其他东西,您需要管理,那家伙就退出了” –保证了不人道的价格标签。而且,他们经常带着旧设备来找我们,这些设备很久以来一直没有制造商的支持。



下一步是将合同分为常规工作和稀有工作。关键是:如果这是一种具有固定持续时间的永久性工作,我们将在一个单独的块中选择它并规定规律性。对于罕见的任务,我们形成了需要能力的解决方案系统列表(即使每年需要一次)。承包商将准备专家。而且它不会包括在主要价格表中。他只需注册这些作品的价格。



我最喜欢的例子是,当客户决定管理包括将站点所运行的服务与服务器一起完全迁移到相距1000 km的另一个数据中心时。例如,将服务器以及与其一起使用的所有物品(网络,存储,它们上的数据...)拿走,我们为它们的管理付费。但这与众不同。通常,我们在单独的项目中挑选出这些东西,然后详细进行迁移。



反应时间



我经常看到一些客户,他们规定了错误的反应时间或根本没有规定反应时间。最好将所有内容都固定在这里,以使期望与现实保持一致。为关键设备编写严格的SLA非常重要:我们通常需要15分钟的响应时间,更换则需要4个小时。但是,如果对数据中心中的所有硬件执行此操作,价格标签将再次变得不人道。还有更复杂的合同。我们的生产设施的平均价格比平时高,但与此同时,我们也同意每小时为停机时间支付几百万卢布。因为生产周期与这些节点相关。我们的值班人员没有注意到服务器上的内存已满或有备件在路上延误了-年底可能仍欠客户。



通常,生产部门在需要一次性工作(作为故障)时,会尝试规定15分钟的SLA,而不了解其背后的原因。要让工程师获得这样的许可,您需要他整年都在值班,并且不要在新年时喝酒(或严格按照与同事下的象棋喝酒)。而且它要花钱​​-而不是一次性提供服务。



当需要保留99%的正常运行时间时,有一份合同,他们为此付出了代价,因为超出了指标。我们查看了基础架构,认为从原则上讲这还不够,因此需要重做一切。合同不包括在内,但我们知道那些决定乘坐的人。没用



报告中



第三喜欢的方法是客户没有设置报告格式。设计您要查看的报告格式。并在合同中注明其频率。如果所有任务均按您的费率执行,那么承包商最好在开始工作之前告知工作时间的初步估计。



这是对“为什么在这里有两个小时而不是一个半小时?”的问题。是永恒的争执。我们按以下方式解决:在维修之前,我们给客户一个估算,其侧面误差为正负10%。我们将大型任务放入具有工作计划和阶段截止日期的项目中。



显然,双方都需要进行控制,这是浪费时间:我们让客户进入我们的系统,并疯狂地削减报告,以免出现意外。因为我们对续订一年,两年,三年和五年感兴趣。我们知道,如果没有完全控制和可预测的感觉,也将不会续签合同。



安排定期会议也很有帮助。每周的第一个月是构建流程,然后减少使用频率,以便供应商与您分享他所看到的建议。然后每月一次,至少每季度一次。我们有一个客户在一个月内离开了外包商,而他甚至都不知道。因为没有对话。他们不听客户的话,像五年前一样做所有事情。也就是说,没有考虑到他的新业务需求。客户试图传达它,但随后他吐口水,开始寻找新的承包商。



文献资料



排名第四的是现场几乎没有文档。是的,我知道没有人喜欢更改基础结构文档。如果您没有将其写在合同中,那么您在那做了一些事情,在这里做了一些修改,但忘了说-一种常见情况。另一种选择是请可以为您保持最新状态的人(有所更改,反映出来)。更换表演者或将伴奏转给内部专家将很容易。



从文件中我们可以找到数百次-只有大约2011年的DRP。而且你不能使用它。在我的记忆中,至少有两种情况使此类客户开始生产。事实证明,他们帮助找出了问题所在-DRP无效,因为IP发生了变化。



别忘了在期末取货



高级外包商维护CMDB:已安装新设备,并将其添加到基础中。一切都保持最新。如果没有自己的CMDB基础,则服务组织总是有一个。好吧,如果它与您无关,请请求访问它。并确保在合同中添加条款-以便在合同终止时将累积的数据传输给您。我们有一个客户,他很高兴他在什么地方得到保证,在什么地方获得许可,这使我们感到高兴。但是当合同终止时,我不得不自己紧急清点所有物品。这是我们的第一项服务,同时还提供了审核服务-先前的交易对手不想共享数据。



不要害怕在合同中包括高额罚款



正常的表演者会很好地对待他们。订阅的意愿表明供应商有信心遵守SLA。唯一的问题-如果您直接控制生产率的下降并确定可用性的百分比,则例如在不适用罚款的过渡期内定一个月。深入研究IT基础架构,更新文档,获得所有访问权限并保证可用性需要一个月的时间。如果有人不加订阅,第一个月您的基础架构就会受到威胁。



顺便说一句,您还需要衡量您认为正在运行的基础架构上的正常性能水平。然后会有一些可以比较的东西,并向表演者表明生产率下降了。否则,您将无法证明这一点。



立即让信息安全专家参与开发过程



这是如此重要,以至于通常它通常会定义项目。再次让我们:立即让信息安全专家参与开发过程。如果您突然没做过,那就麻烦了。大多数情况下,它们是远程管理的,因此供应商需要了解需求。例如,对于某些客户端而言,从其进行连接的专用工作站的视频监视至关重要。银行更加严重-它们具有直接的GOST和中央银行的要求。拟定技术规格的最佳方法是直接参考技术规格中的内部规定,而不提供技术规格,这将大大提高价格。



我们遇到了一个案例,他们无法签署合同三个月,CIO挂断了电话。安全人员想要实施GOST,我们希望他展示现在如何实施(怀疑不可能),并提出发送变体。他没有发送。结果,他们写道:“如果三天内您没有收到对技术任务建议案文的评论,那么我们认为它已同意。”然后将公司负责人放在副本中。 IB发出了一个短语:“必须在48小时内安装消除关键IS漏洞的更新和补丁。”就这样。我们可以说它已经过去了。



通常,信息安全性的主题是油腻又滑溜的。安全的人生活在自己的世界中。一切都很酷,基础设施专家相互同意,承包商正在实施。然后您来到公司,然后您:去第一个部门进行谈判。然后他们坐在凳子上问问题,因为没有人通知他们发生了什么事。



哦,是的,并且不要忘记注意管理员必须有权访问该对象。而且很难远程更改服务器中的零件。由于其中有一个事实,即公司的全球团队(印度的IT主管)必须批准工程师的物理访问请求,因此我们不得不等待一个项目等待五到六个小时。



服务台很重要



如果您想在线查看应用程序,请不要太懒惰,以免注册将Service Desk系统与承包商集成或需要Web门户的可能性。这样,您可以透明地控制执行。许多通过邮件工作的客户只会收到消息“您的票对我们非常重要,我们将尽快处理。”就是这样,超越了黑匣子。如果情况很危急,每个人都想看到优先级,他们想看看谁在工作,微控制器。有人要求每十分钟打一次电话。现在,我们有一个专职的人员站在工程师旁边,不会干涉他的解决问题,但是同时会通知客户有关紧急情况的状态,当一切正常时,什么都没有发生,并且每个人都很紧张。



一家银行的情况也很酷,内部标准中描述了应对事件的规则。幸运的是,他们把它给了我们。2005年写了300页,2018年又更新了一组拐杖。通常,除其他外,合乎逻辑的是,有一种程序可以通过收集Skype上重要人物的聊天记录来响应事件。在晚上,您需要给所有有兴趣的人打电话,然后在那里退订。Skype并不是那么活跃。我不得不重新安装它。



证书不应在公司中,而应在项目的专家中



简单的建议:确保承包商的专业水平,这些都是公司的证书和经验。



较难的技巧是确保这些人会参与您的项目。有些直接写给传统知识的公司可以参加工作,也可以不参加。受训人员不适合与关键系统一起工作。您可以这样写:“由我们的专家测试专家”。我见过一个男人带着一堆指示来到铁板上。说:“他们在尤达(Yuda)上发现了我五千卢布。”



碰巧他们给出了一个很不错的清单,赢得了比赛,有一些人参加了启动会议-还有其他一些人没有参加,没有几个必要的能力。我知道市场上有一些团队更换过3次的案例。在金融领域,程序很简单:列出了哪些人可以接触基础架构。他们只在白名单上才不容许任何人那样。



最后



写下所有要求,工作类型,应用程序类型,并在XLS中创建一个无法编辑字段的表单。因为供应商经常尝试编写自己的东西,因此无法进行进一步的比较。我知道建议很简单,但很少有人使用。然后浪费大量的时间来找出谁答应了什么,谁在价格上更有利可图。



样例项目



我们为一家零售公司提供支持,该公司在俄罗斯所有地区都设有商店(一年中商店数量增加了13%)。该基础结构由来自不同制造商的1400个职位组成,对于企业来说至关重要的功能在其基础上运行。IT承担着大量的开发任务。在那里,即使基础架构支持也是如此,以至于IT部门无法独自应对。设备很多,必须以某种方式管理其生命周期。通常,他们将日常任务外包了五年。我们和他们在一起已经两年了。在任务中:



  • 24 x 7全天候监控计算基础架构和虚拟化环境。
  • 在15分钟内针对严重情况,根据监视结果将有关问题告知相关负责人。
  • 输入制造商提供的备件更换,更换的申请,并告知恢复工作。
  • , / .
  • 1400 CMDB.
  • , CMDB.


我们有一个团队:第一行负责监视和归档供应商的应用程序,第二行负责现场工作,第三行负责相关领域(当应用程序软件无法正常工作并且不清楚问题出在哪里时)。有专门的技术经理,他负责监督和协调所有技术专家;分别负责CMDB;一个单独的服务经理负责整个项目的协调。



关于合同。我必须立即说,它包含所有工作的SLA,以及未履行的罚款。由于每个设备都有价目表,因此有可能按季度修订受支持设备的清单,并且可以轻松地重新计算成本。我们还定期与客户举行会议,讨论工作结果和未来计划。



结果是每年为客户节省5500小时,这是他们自己的员工在开发项目上花费的时间。SLA履行的99.9%(就通知条款而言,第一个月有两次违规,由于定期反馈,已予以纠正)。得益于最佳设置,来自监视系统的通知数量减少了30%。当被问及我们的工作方式时,CIO回答:“我们没有听说您。” 他知道这很重要。



TK模板在这里如果您在签署前阅读并讨论一次,共有16页的地狱官僚机构,这将节省所有各方的神经和数百小时的工作时间。



All Articles