检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
了解 云运维中心(Cloud Operations Center)承载华为云确定性运维业务场景,为用户提供集中、简化、一站式的运维工作台。 产品介绍 什么是COC 产品功能 产品优势 约束与限制 03 使用 为您讲解COC各类功能的详细操作使用流程,帮助您从0到1构建运维驾驶舱。
操作系统安装规则见表1。 自定义安装规则见表2。 表1 操作系统安装规则 类型 可选项 说明 产品 全部 Huawei Cloud EulerOS1.1 Huawei Cloud EulerOS2.0 选择补丁的产品属性,在补丁扫描修复时将会过滤出该产品的补丁。 分类 全部 Security
资源批量操作 概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
https://IP:PORT/v1/external/incident/handle Request Headers: Content-Type: application/json X-Auth-Token: MI*******ghkgB { "incident_num":"IM202403221515060171753781"
coc:instance:startRDSInstance 启用RDS实例的权限。 √ √ x x coc:instance:stopRDSInstance 停止RDS实例的权限。 √ √ x x coc:instance:restartRDSInstance 重启RDS实例的权限。 √ √ x
https://IP:PORT/v1/external/incident/handle Request Headers: Content-Type: application/json X-Auth-Token: MI*******ghkgB Request Body: { "incident_num":"IM
批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 Global 批量RDS操作 批量RDS操作为用户提供了管理RDS实例的能力,支持进行批量开启、停止、重启等操作。 Global 批量FlexusL操作 批量FlexusL操作为用户
按钮,进入委托编辑页面; 图18 编辑执行租户委托的信任策略1 在“信任委托”tab页点击“编辑信任策略”,在Pricipal中添加以下json数据: "IAM": [ "${目标组织管理员租户的租户ID}" ], 点击右下角的“确定”按钮,信
cn-north-1.myhuaweicloud.com/v3/auth/projects Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs.huaweicloud
智能化混沌演练 全旅程混沌工程解决方案,快速评估应用潜在韧性风险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,用户开箱即用。
流时无重大稳定性风险。 解决方案 混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程
单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。 未创建过诊断或创建新诊断,具体操作如下。 单击“创建诊断”。 选择资源类型和资源。
设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤8,执行步骤9。 设置“执行作业”。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。
通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪 图2 应用资源统计数据 单击“待处理事件”
COCServiceAgencyDefaultPolicy COC服务跨账号访问场景下的服务委托策略 所有资源 [包含未来新增项目] 资源批量操作对ECS、RDS等服务实例重启、切换操作系统 表2 ServiceLinkedAgencyForCOC包含的权限 权限 授权项 使用场景 下发agent作业
5秒。 受理待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,选择“待处理的”页签。 单击列表数据中的“待办名称”,进入到“待办详情”,单击右上角的“受理”,即可完成受理。 图8 受理待办 当前登录人只能受理责任人为自己的待办。 取消待办 登录COC。 在左侧导航树选择“任务管理
创建参数:需要操作类权限:coc:parameter:create 更新参数:需要操作类权限:coc:parameter:update 资源类权限(具体到某一个region下 && 某一个租户的一个参数):coc:*:*:parameter:name(第一个*代表所有regionID,第二个*所有租户,name代表参数名称)
演练任务名称 根据命名规则,自定义演练任务的名称。 test-drill 期望恢复时长(分钟) 从故障发生到故障恢复的预期时间,单位为分钟。 在故障注入之后,应用自恢复或在执行应急预案时恢复到正常状态的期望时间,该时间不会对演练任务产生影响。 3 单击“添加一个新的攻击任务”。 默认有1个
生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud Operations Center创建一个自定义故障攻击场景的演练任务。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面
可以对ECS实例执行单独或批量重装的操作。 补丁修复 可以对目标实例上不合规的补丁进行修复。 补丁扫描 可以扫描目标实例补丁的合规性。 执行API 可以用来调用某个云服务注册在API Explorer上的OpenAPI。如果OpenAPI是一个异步调用,可以使用等待API结果原子动作来等待目标对象达到预期状态。