检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
获取自定义脚本详情 功能介绍 获取脚本详情 约束条件: 只能查询自定义脚本详情 URI GET /v1/job/scripts/{script_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 script_uuid 是 String 脚本UUID 请求参数 无 响应参数
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景
改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准
P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询、请求类问题 父主题: 事件管理
触发类型有: 事件单 告警单 待办任务 问题单 选择级别 当触发类型为事件单,级别有 P1 P2 P3 P4 P5 当触发类型为告警单,级别有 紧急 重要 次要 提示 当触发类型为待办任务,级别有 紧急 重要 次要 提示 当触发类型为问题单,级别有 致命 严重 一般 提示 选择应用
统计各个时间窗范围内,WarRoom的拉起次数 天/月 个 回溯改进 回溯总数 问题管理 所有的回溯单数量 统计时间周期内,所有的回溯单数量 天/月 个 回溯闭环率 问题管理 统计回溯单的闭环情况 闭环率=已闭环回溯单数量/回溯单总量*100% 天/月 百分比 改进总数 问题管理 所有的改进单数量 统计时间周期内,所有的改进单数量
概述 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能:
错误码 错误码 状态码 错误码 错误信息 描述 处理措施 400 COC.00040601 Exist script with same name: test1111_param. 存在相同名称的脚本 修改脚本名称 400 COC.00040701 Internal server
调用说明 云运维中心提供了REST(Representational State Transfer)风格API,支持您通过HTTPS请求调用。 父主题: 使用前必读
的员工设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。如果华为号已经
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
可编辑参数值。 d.输入执行用户,输入超时时间。 e.选择实例方式分为手动选择:用户手动勾选实例。选择全部:选择单region或者单应用关联的全部实例。 手动选择实例方式:单击“添加实例”,弹出实例选择弹窗。选择方式“手动选择”,根据“企业项目““视图类型““资源类型”、“区域”
om群组。提供Warroom作战平台、关键监控数据看板集成、关键变更操作集成、故障恢复操作平台。支持内外部Warroom联动,协助客户进行问题解决。 Global 流转规则 流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,进行多
单击“确认”。 表1 修改分组参数说明表 参数 说明 示例 分组名称 组件下分组信息,自定义分组名称,必填项 测试分组 资源关联方式 该分组关联资源的方式,必填项。关联方式有两种:手动关联、智能关联。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过
组件下分组信息,自定义分组名称,必填项。 测试分组 云厂商 分组所属的厂商信息,必填项。 / 区域 分组所属的区域信息,必填项。 / 资源关联方式 该分组关联资源的方式,必填项。关联方式有两种:手动关联、智能关联。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过
测试组件 分组名称 组件下分组信息,自定义分组名称,必填项 测试分组 云厂商 分组所属的厂商信息,必填项 / 资源关联方式 该分组关联资源的方式,必填项。关联方式有两种:手动关联、智能关联。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过