检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
显示检查项信息,可以根据需要选择对应的检查项。 图3 制定检查项信息 单击选择检查项的“必要性”级别。 如果必要性为A的检查项不通过时PRR评审将不通过。 图4 选择检查项的必要性级别 填写完成后,单击 “确认” 图5 制定PRR模板完成 查看PRR模板详情 登录COC。 在左侧菜单栏选择“韧性中心
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过云运维中心查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“
操作脚本工单 功能介绍 操作类型:取消实例、跳过批次、取消整个工单、暂停整个工单、继续整个工单 URI PUT /v1/job/script/orders/{execute_uuid}/operation 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是
查看告警 操作场景 通过云运维中心查看汇聚告警发生时间、收敛数量、所属应用、告警等级等汇聚告警相关信息。 并可以通过搜索框查看符合搜素条件的汇聚告警相关信息。 操作步骤 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
SLO指标配置 用户可以通过此页面查看SLO指标配置。 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。
在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。
审批名称自动生成。 审批人通过排班场景和排班角色决定。 审批方式:一人通过 或 全部通过。 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
历史告警 操作场景 通过云运维中心查看清除过的告警信息。 在历史告警页签中,您仍然能查看汇聚告警的相关信息和处理记录等。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 图1 历史告警列表 在集成告警列表“操作”列选择
概述 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。
与会成员 操作场景 与会成员主要是为了快速恢复故障,将参与故障恢复的人员拉入群组,或通过电话或短信及时通知故障恢复人员响应并处理故障。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom
事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件单暂停功能,可参考基础配置-事件流程。 图1 事件流程图 父主题: 事件管理
作业工单 提供用户查看、操作作业工单的能力。 前提条件 用户下发了执行作业的任务,系统生成对应的作业工单。 操作场景 通过Cloud Operations Center查看作业工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“
首次安装UniAgent如何操作? 登录COC。 在左侧菜单栏单击“应用资源管理”,进入“资源管理”页面,选中首台未安装过UniAgent的机器。 图1 安装UniAgent 在跳转的安装UniAgent页面中,单击 “手动安装”。 图2 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
E集群两种场景。COC通过补丁基线中的规则,对主机的OS补丁进行扫描并且提供合规性报告。COC提供三条公共补丁基线,同时支持用户自定义创建补丁基线。用户可以自定义补丁安装规则、补丁的合规性级别、补丁例外。 使用补丁管理包含以下步骤: 创建补丁基线,基于操作系统及对应的补丁扫描基线。
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题
安全评分 操作场景 通过云运维中心查看安全云脑 SecMaster的安全监控信息,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑
脚本,通过该脚本实现重置密码效果,不会重启实例,您可通过执行相应的公共脚本来重置实例(目前支持ECS和BMS资源类型)的密码。 图1 执行重置密码公共脚本 您在COC中执行公共脚本时,需要选择实例,而能够选择到实例的前提条件为: 您的资源实例信息已经同步到COC中,具体操作指导请见:同步资源;
标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则,将原始告警清洗为事件单或告警单,帮助用户进行统一的告警管理。当原始告警命中
快速配置中心 操作场景 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管