检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障模式和区域。并且可以对后续的演练任务进度进行跟踪。 图3 通过演练规划接单进入创建演练任务页面 父主题: 混沌演练
调用说明 云运维中心提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用。 父主题: 使用前必读
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
/v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本uuid 最小长度:1 最大长度:25 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 description 是 String
可以对ECS实例执行单独或批量切换操作系统的操作。 关机ECS操作系统 可以对ECS实例执行单独或批量关机的操作。 重装ECS操作系统 可以对ECS实例执行单独或批量重装的操作。 补丁修复 可以对目标实例上不合规的补丁进行修复。 补丁扫描 可以扫描目标实例补丁的合规性。 执行API 可以用来调用某个云服务注册在API
绑定产品 操作场景 产品组合由一个或多个产品构成,用户通过产品组合管理产品。您可以根据需要为产品组合添加或移除产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 绑定产品 登录云运维中心。
操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。
持转发责任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 关联APM环境 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 APM相关操作请参考APM应用管理。
仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 testValue 关联APM环境 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 APM相关操作请参考APM应用管理。
手机号:用户使用的手机号码 邮箱:用户使用的邮箱号码 企业微信:用户企业微信群聊机器人的webhook地址 钉钉:用户钉钉群聊机器人的webhook地址 飞书:用户飞书群聊自定义机器人的webhook地址 人员信息中的通讯方式用途简介: 在编辑通讯方式保存后,系统后台会创建对应的消息通知
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
错误码 状态码 错误码 错误信息 描述 处理措施 400 COC.00040601 Exist script with same name: test1111_param. 存在相同名称的脚本 修改脚本名称 400 COC.00040701 Internal server error 服务内部错误
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
支持按照变更应用、变更级别、状态和变更标题筛选。 若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。 变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。 优先按变更计划开始时间早的排前面 。 计划开始时间相同,按创建开始时间排序。