检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
0021","message":"Failed to check Cinder quotas because the number of Gigabytes exceeded the upper limit."或 CreateRootVolumeTask-fail: call evs api
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 父主题: PRR评审
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。 图1 查看待办中心列表
标签管理 提供用户为自定义作业和作业工单添加标签的能力。 操作场景 通过Cloud Operations Center为一个自定义作业或者作业工单添加标签。 创建标签 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 在“作
选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”进入“添加新的攻击任务”界面。 图3 选择攻击任务 1.任务组间的任务为串行执行,任务组内的任务为并行执行。 2.当前不支持一个任务组内对同一个资源的多次故障注入。 添加新的攻击任务,可以选择新创建攻击任
可用区(AZ,Availability Zone) 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个
执行API 该原子动作可以用来调用某个云服务注册在API Explorer上的OpenAPI。如果OpenAPI是一个异步调用,可以使用等待API结果原子动作来等待目标对象达到预期状态。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。
访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有COC的使用权限,但是不希望他们拥有删除COC等高危操作的权限,那么您可以使用IAM为开发人员创建用户进行权限分配,通过授予用户仅能使用COC,但是不允许删除COC的权限策略,控制开发人员对COC资源的使用范围。 权限根据授权精细程度分为角色和策略。
班角色是作为组合项)不能同时为空,必须选择一个 最小长度:0 最大长度:255 数组长度:0 - 1 assignee_scene 否 String 排班场景,排班场景和排班角色(排班场景和排班角色是作为组合项)不能同时为空,必须选择一个最小长度:0 最大长度:255 assignee_role
"********", //IAM用户密码 "domain": { "name": "domainname" //IAM用户所属账号名 }
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
自定义故障 操作场景 通过Cloud Operations Center创建一个攻击场景为自定义故障的演练任务。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器
提供用户创建应用的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建应用。 注意事项 同一个应用下不能同时存在子应用和组件。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,单击“创建应用”。
全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。 图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。
管理自定义脚本 提供用户修改、删除已录入的自定义脚本的能力。 操作场景 通过Cloud Operations Center修改、删除一个待执行自定义脚本。 注意事项 在修改脚本时确认脚本内容的风险等级,并如实填写风险等级。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,
"password": "********", "domain": { "name": "domainname" } }
创建问题 操作场景 通过Cloud Operations Center创建一个问题单。 前提条件 需要先在应用管理中创建您的应用。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。
创建变更单 操作场景 通过Cloud Operations Center 创建一个变更单。 前提条件 1、需要先在应用管理中创建您的应用 2、需要在排班管理创建变更审批人的排班 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理