检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景
演练报告 创建演练报告 演练结束后可以创建演练报告 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 图1 演练任务列表 找到需要查看的演练任务,单击“操作”列“演练记录”,进入“演练记录”列表。在演练记录列表“操作”列,单击
获取自定义脚本详情 功能介绍 获取脚本详情 约束条件: 只能查询自定义脚本详情 URI GET /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 无 响应参数
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
导入IDC离线资源 提供用户导入IDC离线资源的能力。 操作场景 通过Cloud Operations Center导入线下IDC离线资源。 操作步骤 登录COC。 在“多云配置”页面中单击“IDC离线资源”。 图1 导入IDC离线资源 单击“下载模板”,下载表格模板录入信息。 图2
批量重装操作系统 操作场景 通过Cloud Operations Center BMS操作批量重装功能进行BMS实例操作系统批量重装。 注意事项 已开机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量BMS操作”模块中单
事件创建改进单 操作场景 事件单受理过程发现该故障有改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 在页面的右侧点击选择创建改
ent。 直连接入(内网) 代理区域 当接入方式选择代理接入时,需选择代理区域。 代理区域是对代理机的分类管理;代理机是指在华为云购买和配置一台华为云弹性云服务器ECS,为解决多云之间网络互通。 - 安装机 安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置:
编辑IDC离线资源 提供用户编辑IDC离线资源的能力。 操作场景 通过Cloud Operations Center编辑线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“编辑”。
删除IDC离线资源 提供用户删除IDC离线资源的能力。 操作场景 通过Cloud Operations Center删除线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“删除”。
批量切换操作系统 操作场景 通过Cloud Operations Center FlexusL操作批量切换功能进行Flexus L实例批量切换操作系统。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择
添加排班人员 前提条件 设置排班人员前,您需要在人员管理中完善您的人员列表,并且需要创建完成排班场景和对应的排班角色。 操作场景 不同排班方式和排班维度添加排班人员会有所不同,具体介绍如下。 排班类型 固定班次 轮班(周一 -- 周日) 全局排班 全局排班+固定班次场景添加排班人员
修改参数 登录COC。 在左侧菜单栏选择“资源运维 > 自动化运维 > 参数中心”,进入“参数中心”页面。单击对应参数的“操作”列“编辑”,进入“修改参数”页面。 图1 参数列表 在“修改参数”页面,参数名称、企业项目、参数类型不可修改,显示如下图。 图2 参数详情 根据实际需求修改参数,单击“提交”即可。
操作脚本工单 功能介绍 操作类型:取消实例、跳过批次、取消整个工单、暂停整个工单、继续整个工单 URI PUT /v1/job/script/orders/{execute_uuid}/operation 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是
身份认证与访问控制 身份认证 用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,
跨账号资源 前置条件 在Cloud Operations Center进行跨账号资源的操作之前,用户需要满足一些前置条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
补丁管理 补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理