检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题
Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响SLO,COC会自动化地完成SLO的计算,为SLO看板大屏提供数据。 父主题: SLO管理
删除应用 操作场景 应用创建后,若想删除应用或子应用,请按如下操作进行。 注意事项 当应用或子应用下存在分组、组件或子应用时,此应用或子应用无法删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。
问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。 是否通过:可选项“通过”、“不通过”。
在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要处理的问题单,单击问题单标题。 单击上方“审批”。 设置“问题挂起审批”。 是否审批通过:可选项“通过”、“不通过”。 审批意见:填写审批详细意见。限制长度0-1024个字符。 单击“确定”。 完成问题单挂起审批。若挂
变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否允许重启:部分补丁需要重启生效,若选择否,则需要您择期安排重启。 单击“提交”并“确定”,开始执行工单。 对于工单执行是否完成,支持以下操作: 若工单执行中: 暂停:单击右上方“暂停”,当前批次执行完成后下一批次暂停执行。
和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤
效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件
概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周
您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量停止 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“云数据库RDS > 停止实例”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
变更管控 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。 前提条件 开启变更管控需要申请IAM权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:p
分。创建应用后,即可为该应用添加子应用、组件等信息。 注意事项 应用结构类型选择大型应用时支持配置子应用。 应用或子应用下同级节点不能同时存在子应用和组件。 创建应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 单击左侧“创建应用”。
列出组织的根 organizations:roots:list 跨账号场景下,查询当前组织的root 修改或删除委托权限 若开通COC后,识别到存在委托权限过大或权限不足的情况,可以前往统一身份认证服务中修改委托策略。 如果需要修改委托的权限、持续时间、描述等,可以在委托列表中,单击委托右侧的“修改”,修改委托。
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“云数据库RDS > 重启实例”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开启 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“云数据库RDS > 开启实例”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。
创建委托指导 背景 若您的企业组织存在多个租户账号,您可以使用COC的跨账号能力在创建CES告警规则、执行作业等场景通过一个账号完成多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。
自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要审批的脚本,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义脚本审批。 父主题: 脚本管理
自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要审批的作业,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义作业审批。 父主题: 作业管理