ITIL v3 (信息技术基础设施库)/服务设计
ITIL V3的另一个视角,服务设计卷重点关注服务本身的定义,基于服务策略的预期如何。其目标是设计和开发IT服务,无论它是新服务的设计还是现有服务的改进。
服务设计不仅仅基于技术,而是解决一个与业务和技术环境大量交互的解决方案,并考虑到支持计划服务所需的整个供应链。
ITIL V3的服务设计流程为
- 设计协调
- 服务目录管理
- 服务级别管理 (SLM)
- 可用性管理
- 容量管理
- IT服务连续性管理 (ITSCM)
- 信息安全管理
- 供应商管理
服务设计遵循以下原则
- 产品组合服务项目
- 业务需求
- 技术项目
- 流程项目
- 度量项目,包括IT-KGI、KGI和KPI
设计服务的关键术语包括
- 关键成功要素:如何定义服务提供成功。
- 停机时间:保证的关键术语之一,表示服务对客户不可用的次数。
- KPI:为服务定义关键绩效指标。
- 可维护性:服务维护的难易程度。
- OLA/UC:与内部或外部供应商的服务协议。
服务设计的四个P是
- 人员
- 流程
- 产品/技术
- 合作伙伴/供应商
交付模式策略列表为
- 内部化:当服务在所有服务阶段使用内部资源时。
- 外包:此模式通过明确定义的服务设计部分设置。它可能使用下面定义的ASP模式。
- 联合外包:它是内部化和外包的组合。
- 伙伴关系或多源:两个或多个组织之间达成协议,共同提供服务。
- 业务流程外包 (BPO):将整个业务职能转移到将提供和管理服务的外部组织。此模式通常意味着更具运营性的合作伙伴,如会计或呼叫中心。
- 应用服务提供商 (ASP):通过正式协议,组织通过网络提供基于计算机的软件。它也被称为按需软件/应用程序。
- 知识流程外包 (KPO):由思考型合作伙伴提供的服务,它领先于BPO一步。通常提供特定领域的专家知识。
- 托管服务提供商 (MSP):更广泛的端到端服务合作伙伴。此模式在ITIL V3中未定义。
在与客户达成协议之前,需要与合作伙伴达成协议。如果服务需要与需要两天时间的供应商交互,则不可能保证服务能够在一天内恢复。
ITIL定义了两种协议形式
- 运营级别协议 (OLA):IT服务提供商与内部服务提供商(同一组织的一部分)之间的协议。
- 支撑合同 (UC):IT服务提供商与外部服务提供商(组织外部)之间的协议。
设计可以通过以下方式度量流程服务
- 进度:里程碑和交付成果。
- 合规性:根据治理标准。
- 有效性:准确性和正确性。
- 效率:资源的优化使用。
服务可以通过三种方式进行度量
- 成功先决条件 (PFS):需要完成的活动。通常,PFS 是另一个流程的输入。
- 关键成功要素 (CSF):什么定义了服务实现成功的[1]。
- 关键绩效指标 (KPI):定义服务已实现成功的指标。
ITIL V3 只建议使用 KPI,它基于 COBIT 建议的元素进行了改进。
服务设计有 10 个流程,如下所示。
确保服务目录的生产和维护,其中包含有关所有运营服务和准备投入运营的服务的准确信息。它包含有关所有服务管理流程的信息:服务详细信息、当前状态和服务的相互依赖关系。
服务目录与业务服务(客户可见的服务,由 SLA 定义)和支持服务(仅在 IT 组织内部可见的服务,由 OLA 和 UC 定义)之间存在明显差异。
根据 ITIL V3,服务目录管理没有指定子流程。
SL 管理的目标是与客户协商服务级别协议,并根据商定的服务级别目标设计服务。服务级别管理还负责确保所有运营级别协议 (OLA) 和支撑合同 (UC) 适当,以及监控和报告服务级别。
服务级别管理是服务级别协议 (SLA)、服务改进流程 (SIP) 和服务级别要求 (SLR) 的粘合剂。SIP 是持续服务改进 (CSI) 卷的重要组成部分。
服务级别要求包含来自客户角度对服务的期望,是达成 SLA 的基础。SLR 中的要求需要用业务术语定义,定义服务级别目标、共同责任以及特定客户或客户群体的其他要求。
SLM 通过以下阶段定义
- 协商:定义服务 SLR 的地方。
- 最终确定:定义 SLA 的地方,在定义 OLA/UC 后。
- 监控:服务监控。
- 报告:服务报告,显示服务是否符合 SLA。
- 修订:用作 SIP 的基础。
SLA 的结构级别可以是
- 企业:当目标是整个企业时。
- 客户:当目标是特定客户或客户群时。例如,财务部门。
- 服务:当目标不具体时。例如,互联网服务,当目标不是仅仅是企业或特定客户时。
- 多级:SLA 可以拆分为不同级别,适用于不同的客户。
此流程涉及通过分析资产价值、威胁以及每项资产对这些威胁的脆弱程度来识别、评估和控制风险。
风险管理包括业务影响和风险分析、评估所需的风险缓解措施以及风险监控。
<风险管理不是ITIL V3的一部分>
确保IT服务和IT基础设施的容量能够以经济高效且及时的方式交付商定的服务水平目标。容量管理考虑交付IT服务所需的所有资源,并规划短期、中期和长期的业务需求。
服务级别协议可以包含许多服务性能指标及其对应的服务级别目标。IT服务管理中一个常见的案例是呼叫中心或服务台。在这些情况下,通常商定的指标包括
- ABA(放弃率):等待接听电话时放弃的电话百分比。
- ASA(平均接听速度):服务台接听电话的平均时间(通常以秒为单位)。
- TSF(时间服务系数):在一定时间内接听的电话百分比,例如 80% 在 20 秒内。
- FCR(首通解决率):无需回拨或让呼叫者回电帮助台完成解决问题的电话百分比。
- TAT(周转时间):完成某项任务所需的时间。
正常运行时间协议是另一个非常常见的指标,通常用于数据服务,例如共享主机、虚拟专用服务器和专用服务器。常见的协议包括网络正常运行时间百分比、电源正常运行时间、计划维护窗口数量等。
许多SLA在应用于IT服务时都遵循ITIL规范。
定义、分析、规划、衡量和改进IT服务可用性的所有方面。可用性管理负责确保所有IT基础设施、流程、工具、角色等都适合商定的可用性目标。
子流程是
- 为可用性设计服务
- 可用性测试
- 可用性监控和报告
一些可能包含在SLA中的可用性测量值
- 平均故障间隔时间 (MTBF):服务从启动到停止运行的经过时间。
- 平均修复时间 (MTTR):修复配置项或IT服务所花费的时间。
- 平均系统事件间隔时间 (MTBSI):两次连续事件之间检测到的经过时间。
- 平均服务恢复时间 (MTRS):从事件检测到恢复运行的经过时间。
基于以上术语,
MTBSI = MTBF + MTRS
,可用性可以通过以下方式计算
A = MTBF / (MTBF + MTTR)
.
MTRS与MTTR的不同之处在于,MTTR是指修复配置项的时间,而MTRS是指修复后恢复服务的时间。例如,MTTR=更改节点CPU的时间,MTRS=恢复该节点提供的服务所需的时间。
IT服务连续性管理 (ITSCM) 旨在管理可能严重影响IT服务的风险。此ITIL流程通过将灾难事件的风险降低到可接受的水平并规划IT服务的恢复,确保IT服务提供商始终能够提供商定的最低服务水平。ITSCM应设计为支持业务连续性管理。
- ↑ Daniel, D. Ronald, "Management Information Crisis," HBR September-October 1961, p. 111.