检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
排班管理中可以设置多种排班,一个排班场景即是一种排班的集合。创建排班场景时,您需要选择对应的排班方式,排班维度。根据您的选择,后续设置排班的方式也会有所区别。 场景角色概述 场景角色是设置排班时的最小单位,一个排班场景中可以创建多个排班角色,在设置排班时可以对每个角色设置不同的值班人。 父主题: 排班管理
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 变更管控:是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的创建配置、删除、编辑修改、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。
on中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制
操作场景 事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。 父主题: 集成管理
每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤
脚本描述:最大256个字符。 单个参数的参数名称 64个字符,只支持字母+数字+下划线。 单个参数的值最大1024个字符,正则表达式如下:^((?!.{2,})[a-zA-Z0-9_-/.*\x20?:",=+@\[{]}])*$。 审批人最多支持5人。 脚本输出的日志总量只支持1MB。 URI
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
管理员在用户列表中,单击新建的用户,右侧的“授权”。 图1 IAM用户授权 授权模型选择“角色授权”。 图2 选择授权模型 授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC FullAccess”或“COC ReadOnlyAccess”策略,策略详情可查看COC权限管理。
选择需要进行扫描的ECS或CCE实例。 图7 选择需要扫描的ECS实例 图8 选择需要扫描的CCE实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同 场景描述:排班场景的详细说明 单击排班场景的“操作”列中“创建排班角色”可为该场景创建排班。
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
operator 是 String 操作人ID,示例:00909e0a9c0a49a1b5e1c3eac362e3d7,可以在【基础配置】【人员管理】中查询到 最小长度:0 最大长度:255 operate_key 是 String 操作类型,固定值:acceptedIncident1 最小长度:0
单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击“添加中断记录”,右边弹出添加中断记录弹框,选择对应的数值,添加中断记录。 图2 添加中断记录 单击右侧“修正”,右边弹出添加中断记录弹框,修改中断的不可用时间。
账号密码管理场景步骤: 导入账号、查看账号密码。 自动改密及免密登录场景步骤: 当前已有资源可自动改密:账号管理-账号基线中配置账号基线。 后续新增资源的自动改密:账号管理-改密策略中配置改密策略。 按照region维度定期改密:账号管理-改密任务添加region。 配置后可查看账号密码、免密登录。
警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。 汇聚告警产生后,条件满足SLA记录设置的级别和应用,生成对应的SLA记录。
在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。 表1 改进处理参数说明 参数 说明 问题原因 请填写问题发生的原因。 限制长度1-1000个字符。 改进措施 请填写详细的改进措施。 限制长度1-1000个字符。