检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表1 转发责任人参数说明
扫描/修复的执行对象及执行结果,可以在“任务管理 > 执行记录 > 补丁工单”页面查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“补丁工单”页签。 用户可以通过ID、区域、工单类型、开始时间、结束时间进行搜索。 图1 补丁工单列表 工单类型:扫描、修复
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上
用户可以通过ID、工单类型、开始时间、状态进行搜索。 图1 资源操作工单列表 状态:已暂停、创建中、执行中、已取消、成功、异常 单击“ID”列对应的“资源操作工单ID”,可查询到对应工单详情。 当工单的状态是暂停状态时,单击“继续”,可以让工单继续。 当工单的状态为执行中时,单击“暂停”,可以让工单暂停。
选择需要启动的产品,单击操作列“启动产品”。 设置“启动产品”。 表1 启动产品参数说明 参数 说明 实例名称 根据命名规则,自定义实例的名称。 版本 在下拉列表选择所需版本。 区域 产品生成的实例所在的区域 参数 填写云产品资源的参数。 说明: 参数与创建产品时编写的模板内容相关,请根据实际情况设置。
单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障模式和区域。并且可以对后续的演练任务进度进行跟踪。 图3 通过演练规划接单进入创建演练任务页面
云运维中心支持通过账号管理免密登录主机(当前仅支持ECS的linux主机)。可以通过免密登录选择账号进入命令执行页面,账号来源于账号基线中配置的账号且OS主机存在的账号。 注意事项 主机可以成功远程登录的前提条件。 安装UniAgent且UniAgent的状态为运行中并UniAgent的版本需要大于1.1.3.8。
application_names 否 Array of strings 应用名称列表 最小长度:0 最大长度:1000 数组长度:0 - 1000 region_names 否 Array of strings region名称列表 最小长度:0 最大长度:1000 数组长度:0 - 1000
单击“确定”。 完成通告更新。最新的通告显示在“进展通告”中。 单击“发布”。 设置“发布通告”。 表2 发布通告参数说明 参数 说明 通报主题 自定义通报主题。 通报对象 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。 单击“创建排班”可以配置排班,详细操作请参考排班管理。
排班管理”页面,选择排班场景、区域及应用,单击“操作”列的“编辑”可增加或删除排班人员。 图4 应用固定场景修改人员 应用排班+轮班班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景,单击“清空人员”。 图5 应用轮班场景排班列表 在清空人员页面选择区域、应用,填写开
修改故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 在WarRoom启动、故障定界和恢复、故障已恢复过程都可以修改故障信息。 修改故障信息 登录云运维中心。 在左侧导航栏选择“故障管理
O中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host 请求的服务器信息,从服务API的URL中获取。值为h
安装机 在下拉列表选择安装机。 选择一台已经安装了UniAgent的主机作为安装机,安装机通过代理的方式作为中间桥梁安装UniAgent到同一个VPC下的其他主机。 需安装UniAgent主机 填写需安装UniAgent主机的详细信息。 主机IP:主机的IP。 操作系统:主机的操作系统,Linux或Windows。
创建新版本 操作场景 产品创建后,默认生成一个基础产品版本。如果管理员需要更新产品的模板内容,可以创建产品的新版本。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 创建新版本 登录云运维中心。
应用拓扑 操作场景 应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 编辑拓扑仅支持编辑组件之间的连线关系。 编辑拓扑不影响应用和组件的层级和功能。 查看和编辑拓扑 登录云运维中心。
操作场景 产品底层基于Terraform或Json构成的云资源模板。根据Terraform及Json的定义,可以是单个云资源,也可以是多个云资源的组合。管理员可以通过入门示例模板或自定义模板创建产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceC
系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。 一般: 次要功能未完全实现、但不影响使用,如提示信息不太准确,或用户界面差,操作时间长,模块功能部分失效等。 提示: 较小错误的软件缺陷,使操作者不方便或遇到麻烦,但不影响功能上的操作和执行。 说明
时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自execute