检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练
(1)warroom的状态为(启动warroom、故障界定); (2)提权应用在warroom的影响应用列表中; (3)提权操作人是warroom的恢复责任人、恢复成员、管理员。 变更单状态校验: (1)提权应用,Region必须与变更单中的一致; (2)此次提权的操作人必须是变更单的实施人; (3)当前操作时间
在样例的“inject_fault”函数中,注入的故障即是“创建一个{FILE}文件,并在{FILE}文件中新增内容”。故障注入成功的标志即为在{FILE}文件中输入了“successfully inject”内容。 2. 在样例的“check_fault_status”函数中,会检测{FILE}文
64bit for Tenant 20210525 UniAgent客户端 当CPU使用率大于10%或者内存大于200M时,UniAgent客户端将自动重启。 UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线
机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题
若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信、钉钉、飞书),需要配置以下信息: (1)在移动应用管理中配置应用。 (2)在人员管理中配置企业微信对应邮箱。 (3)若选择排班,需要先创建排班并给排班中添加排班人员,添加排班和参与者后,会在起会规则命中时拉入企业微信。 父主题: 事件管理
请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 region 否 Array of strings 区域Code,如果自动拉起WarRoom则为必填,现在只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 enterprise_project 否
IAM项目和企业项目,表示此授权项对应的自定义策略,可以在IAM和企业管理两个服务中给用户组授权并生效。如果仅支持IAM项目,不支持企业项目,表示仅能在IAM中给用户组授权并生效,如果在企业管理中授权,则该自定义策略不生效。 关于IAM项目与企业项目的区别,详情请参见:IAM与企业管理的区别。
若不使用系统预置的变更场景,可将是否开启列表中开关关闭。若需要新增变更场景,单击“新增变更场景”,添加变更场景信息。添加后可在变更管理>变更中心创建变更页面中填写变更类型查看最新的枚举值。 图2 新建变更场景 父主题: 流程管理
索。 图1 资源操作工单列表 状态:已暂停、创建中、执行中、已取消、成功、异常 单击“ID”列对应的“资源操作工单ID”,可查询到对应工单详情。 当工单的状态是暂停状态时,单击“继续”,可以让工单继续。 当工单的状态为执行中时,单击“暂停”,可以让工单暂停。 当工单状态为非完成状
事件历史记录 操作场景 若需追溯事件处理阶段中某个节点做了什么操作,可以查看事件的历史记录,事件历史记录包含事件的整个处理过程。 事件历史记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要查看的事件单,单击事件标题。 单击上方“事件历史”。
应用韧性评估”。 单击操作列“查看报告”。 查看最新的评估报告详情。 1. 评估报告详情中,给出了识别到的风险项,并给出优化建议。 2. 若您认为部分风险项可以不进行优化,则可在查看评估报告详情中,点击“忽略风险”按钮,将其忽略。 父主题: 应用韧性评估
编辑标签”。 克隆:单击“克隆”,将跳转至执行作业,可按照执行自定义作业中的操作步骤再次执行该作业。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图1 作业工单 选择一个状态为“执行中”或“异常”或“已暂停”的作业工单,单击对应的“作业名称”,进入“作业工单详情”页面。
”。 通报内容 根据选择的通报模板填写通报内容。 限制长度1-1000个字符。 单击“确定”。 完成通告更新。最新的通告显示在“进展通告”中。 单击“发布”。 设置“发布通告”。 表2 发布通告参数说明 参数 说明 通报主题 自定义通报主题。 通报对象 可选项“排班”、“个人”。
指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。
> 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完成问题单受理,问题单状态为“定位出方案中”。 父主题: 问题管理
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
incident_num String 事件单号 最小长度:0 最大长度:255 region Array of strings 区域Code,如果自动拉起WarRoom则为必填,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 enterprise_project Array
t和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 表2 Query参数 参数 是否必选 参数类型 描述 status 否 String 实例执行状态 READY:待执行 PROCESSING:执行中 ABNORMAL:异常 CANCELED:已取消