检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
诊断工具 OS诊断 父主题: 故障管理
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
PRR模板和检查项信息。评审过程中,用户可以上传自检材料,并在评审完成后录入评审纪要。对于需要改进的检查项,用户可以创建改进事项。 PRR模板管理 PRR模板是用于进行 PRR评审的一种工具,它包含了产品立项、产品设计、产品上线三个阶段的检查项信息。用户可以通过 PRR模板管理页面进行
概述 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照事件和问题管理流程制定级别的类别的枚举值,便于满足当前业务。 父主题: 流程管理
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
批量RDS操作 批量开启 批量停止 批量重启 父主题: 资源批量操作
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
解决方案参数说明 参数 说明 短期方案(故障如何恢复) 请填写故障的短期方案。 单击“添加文件”上传短期方案相关附件。 支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。 长期方案(如何避免再次发生) 请填写故障的长期方案。 单击“添加文件”上传长期方案相关附件。
确认演练目标主机或容器所属应用,事件级别是否正确。 登录COC。 在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。 图2 故障模式页面 填写故障模式信息。 图3 创建故障模式 表1 故障模式参数说明 参数名 参数描述 故障模式名称 用户自定义故障模式名称 所属应用
图2 接入集成 在接入集成页面,按照集成接入步骤,完成告警接入配置。 图3 集成接入步骤 完成告警接入配置,单击“确认集成”。 图4 确认集成 步骤二:创建流转规则,清洗原始告警数据 登录COC。 在左侧导航栏选择“故障管理 > 流转规则”,进入“流转规则”页面。 在流转规则
批次索引,从1开始 total_instances Integer 批次内执行实例数量 execute_instances Array of ExectionInstanceModel objects 执行实例列表,分页 表4 ExectionInstanceModel 参数 参数类型
com/v3/projects" } } 从控制台获取项目ID 从控制台获取项目ID的步骤如下: 登录管理控制台。 鼠标悬停在右上角的用户名,选择下拉列表中的“我的凭证”。 在“API凭证”页面的项目列表中查看项目ID。 单击用户名,在下拉列表中单击“我的凭证”。 在“我的凭证”页面的项目列表中查看项目ID。
支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝对指定资源在特定条件下进行某项操作。 对应API接口:自定义策略实际调用的API接口。
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
故障管理 事件管理 WarRoom 集成管理 父主题: API
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理