检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(3)提权操作人必需与事件分析处理阶段的当前责任人一致; (4)提权区域必需与事件单的区域一致。 Warroom状态校验: (1)warroom的状态为(启动warroom、故障界定); (2)提权应用在warroom的影响应用列表中; (3)提权操作人是warroom的恢复责任人、恢复成员、管理员。
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情
在编辑、克隆作业时确定作业的风险等级,并如实填写风险等级。 编辑自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”,进入“修改作业”页面。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,按下“回车”键即可搜索
安全 责任共担 身份认证与访问控制 审计与日志 服务韧性 认证证书
使用前必读 概述 调用说明 终端节点 约束与限制 基本概念
您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。 图2
排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 场景描述:排班场景的详细说明。 角色名称:排班角色的名称。 排班场景:可选择当前已创建的排班场景。 角色描述:排班角色的详细说明。 排班方式 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。
在编辑脚本时确认脚本内容的风险等级,并如实填写风险等级。 编辑自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“脚本管理”,进入“脚本管理”页面。 在“自定义脚本”页签,选择需要编辑的脚本,单击操作列“编辑”,进入“修改脚本”页面。
返回结果 状态码 请求发送以后,您会收到响应,其中包含状态码、响应消息头和消息体。 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同 场景描述:排班场景的详细说明 单击排班场景的“操作”列中“创建排班角色”可为该场景创建排班。
脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。 校验高危命令:可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表。
启用/禁用:禁用状态下的定时运维任务不生效,禁用状态才能启用,启用状态下才能禁用。 编辑:您可以根据需要,自行修改定时运维任务的名称、版本号、任务类型等。 删除:若定时运维任务已经无需使用,您可以删除该任务。 启用、禁用定时任务 用户仅能启用/禁用自己创建的定时任务。可查看当前租户账号下其他用户创建的定时任务。
邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据与资源,支持的跨账号管理的功能有运维态势感知、资源管理和作业管理。 父主题: 开通云运维中心并授权使用
"${目标组织管理员租户的租户ID}" ], 点击右下角的“确定”按钮,信任策略编辑完成,继续点击页面右下角的“确定”按钮,执行账户信任COC同时信任组织管理员的委托即创建完成。 图19 编辑执行租户委托的信任策略2 图20 编辑执行租户委托的信任策略3 组织管理员
密失败原因”为“导入的账号不参与改密”。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 主机资源状态为“运行中”。 主机的UniAgent状态为“运行中”。 主机OS上的账号与所绑定的账号基线中的账号一致。 增量的ECS主机改密条件: 改密策略已开启。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
选择时间周期内,WarRoom的数量 天/月 个 PRR评审汇总 PRR评审服务 PRR评审 统计参与PRR评审的应用数量 参与PRR评审的应用数量 天/月 个 PRR评审通过情况 PRR评审 统计在PRR各阶段中,通过与未通过的服务数量 PRR各阶段,通过与未通过的服务数量 天/月 个 TOP5故障