检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
转移资源 操作场景 分组关联资源后,若您需要将分组内的资源移动至其它的分组内进行管理,请按如下操作进行。 注意事项 只有资源所属的企业项目与应用所属的企业项目相同时才支持转移。 转移资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。
问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“现网实施”。 设置“现网实施”。 若区域涉及变更,点击操作列关联变更单并进行变更实施。变更单相关操作请参考变更中心。 若区域不涉及变更,点击操作列的“不涉及变更”。 支持添加区域和删除已有区域。
修改故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理
事件级别 操作场景 系统提供的事件级别名称描述和业务流程定义的事件级别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
资源操作工单 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 在“资源运维 > 资源批量操作”中执行批量操作任务后,若您需要跟踪和记录任务的执行对象及执行结果,可以在“任务管理 > 执行记录 > 资源操作工单”页面查看。
若需追溯事件处理阶段中某个节点做了什么操作,可以查看事件的历史记录,事件历史记录包含事件的整个处理过程。 事件历史记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要查看的事件单,单击事件标题。 单击上方“事件历史”。 父主题:
单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。 启用/禁用公共SLA
智能关联资源 操作场景 为您提供通过企业项目和标签的形式,将企业项目下的相同标签资源实例关联至同一资源分组内进行管理。 注意事项 需要分组的资源关联方式为智能关联时,才支持智能关联功能。修改资源关联方式相关操作请参考修改分组。 需要先单击对应分组,智能关联资源按钮才能生效。 触发
您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图1 查看应急预案 克隆公共预案 登录COC。 在左侧菜单栏选择“韧性中心
问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。
单击“产品组合管理 > 产品组合”。 单击“创建产品组合”。 设置“创建产品组合”。 表1 创建产品组合参数说明 参数 说明 名称 根据命名规则,自定义产品组合的名称。 创建人 产品组合的创建人。默认为当前用户。 描述 可选参数,请填写产品组合的详细说明。 单击“确定”。 完成产品组合创建。 父主题:
选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图4 选择执行中的脚本工单 单击“暂停”或“强制结束”,即可暂停执行或结束脚本工单。 图5 操作执行中的脚本工单
账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪 图2 应用资源统计数据 单击“待处理事件”、“待处理告警”、“我的待办”,可跳转至相应的运维事务。
参数详情 操作场景 若想查看参数的详情及版本历史,查看敏感参数值和解密数据,请按如下操作进行。 查看参数详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“参数中心”。 选择需要查看的参数,单击参数名称。 若参数类型为加密文本:单击参数
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影