检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
问题待现网实施 操作场景 问题单定位方案如果判断需要进行现网变更,问题单会走到待现网实施阶段。此时需要在问题区域实施变更,变更完成后问题单才算解决。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 现网实施 登录云运维中心。 在左侧导航栏选择“故障管理
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
补丁操作出现lsb_release not found异常如何处理? 1.请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1.1
限制长度1-1000个字符。 是否需要现网变更 可选项“需要”、“不需要”。 需要:工单走到待现网实施阶段,需要关联变更单。 不需要:工单会走到待验证状态。 单击“提交”。 完成问题单定位出方案,若是否需要现网变更选择“需要”,问题单状态为“待现网实施”,若是否需要现网变更选择“不需要”,问题单状态为“待验证”。
问题单处理完成后,需要问题创建人验证问题是否已解决,若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。 是否通过:可选项“通过”、“不通过”。
您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
的合规状态。 注意事项 若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations Center补丁管理支持操作系统。 该实例是否处于关机状态。 创建扫描任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。
验证事件 操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响SLO,COC会自动化地完成SLO的计算,为SLO看板大屏提供数据。 父主题: SLO管理
在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要处理的问题单,单击问题单标题。 单击上方“审批”。 设置“问题挂起审批”。 是否审批通过:可选项“通过”、“不通过”。 审批意见:填写审批详细意见。限制长度0-1024个字符。 单击“确定”。 完成问题单挂起审批。若挂
和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤
变更管控 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。 前提条件 开启变更管控需要申请IAM权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:p
公共作业是云运维中心提供的预定义作业,用户对公共作业具有只读和执行权限,作业管理提供基础的公共作业列表,支持在目标资源执行公共作业。 注意事项 在执行公共作业前需要确认是否拥有目标实例的资源权限。 执行公共作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。
inject”内容。 2. 在样例的“check_fault_status”函数中,会检测{FILE}文件是否存在。若不存在,则可能是故障已经被清理结束,此处返回exit 1。若存在,则检测故障注入成功的标志是否存在,若存在该标志,则表示故障注入成功,此处“sleep {DURATION}”用于模拟
自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要审批的作业,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义作业审批。 父主题: 作业管理
自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要审批的脚本,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义脚本审批。 父主题: 脚本管理
公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。