检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom 概述 WarRoom状态 修改故障信息 影响应用管理 与会成员 进展通告 起会规则 父主题: 故障管理
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。 设置完成后,单击“提交”。 完成自定义作业编辑。 克隆自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理
错误码 错误码 状态码 错误码 错误信息 描述 处理措施 400 COC.00040601 Exist script with same name: test1111_param. 存在相同名称的脚本 修改脚本名称 400 COC.00040701 Internal server
云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。 图1 查看风险项 单击“去优化”跳转优化顾问。 图2 跳转优化顾问 父主题: 总览
在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。 选择“未解决”将会驳回事件,事件流程重新变为“待处理”。
续通知。 支持设定SLA预警目标,即将打破SLA时,提前指定时间发送通知。 支持查看SLA记录,包含工单ID,SLA状态,SLA规则等关键信息。 创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。 自定义SLA优先级高于公共SLA,部分应用优先级高于全部应用。
事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。事件
脚本执行参数 execute_batches 是 Array of ExecuteInstancesBatchInfo objects 目标实例分批信息 表3 ScriptExecuteParam 参数 是否必选 参数类型 描述 resourceful 是 Boolean 是否资源受限,true表示不受限,false表示受限
通知方式 可选参数,可选项“短信”、“电话”。 支持多选,“企业微信”、“钉钉”、“飞书”三种通知方式由选择的与会方式自动关联。 配置用户信息请参考人员管理。 排班人员 可选参数,在下拉列表选择排班。 支持多选,选择排班后会自动选择排班内所有成员。 配置排班请参考排班管理。 个人成员
在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。 单击“补丁基线”。 单击“创建补丁基线”,设置“创建补丁基线”。 表1 基本信息参数说明 参数 说明 示例 基线名称 根据命名规则,自定义补丁基线的名称。 测试基线 描述 可选参数。对补丁基线进行描述。 - 场景类型
系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。 一般: 次要功能未完全实现、但不影响使用,如提示信息不太准确,或用户界面差,操作时间长,模块功能部分失效等。 提示: 较小错误的软件缺陷,使操作者不方便或遇到麻烦,但不影响功能上的操作和执行。
通过Cloud Operations Center创建一个自定义故障攻击场景的演练任务。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,参考演练任务,新建攻击任务。 先填写攻击任务名称,攻击目标来源选择选择弹性云服务器 (ECS),在下方列表里选择对应的机器,单击“下一步”。
系统主要功能部分丧失、数据不能保存,系统的次要功能完全丧失,问题局限在本模块,导致模块功能失效或异常退出。 一般: 次要功能未完全实现、但不影响使用,如提示信息不太准确,或用户界面差,操作时间长,模块功能部分失效等。 提示: 较小错误的软件缺陷,使操作者不方便或遇到麻烦,但不影响功能上的操作和执行。
alarm ok alarmSource 是 String 告警源 最小长度:1 最大长度:255 additional 否 Object 告警附加信息 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 provider_code String 服务标识 缺省值:049
PAUSED CANCELED FINISHED properties JobScriptOrderListProp object 标签:区域信息等 表4 JobScriptOrderListProp 参数 参数类型 描述 region_ids String CMDB服务实例区域id,可能有多个
00040701", "error_msg" : "error_msg" } 状态码 状态码 描述 200 脚本uuid 400 包含错误信息 错误码 请参见错误码。 父主题: 脚本管理
最大长度:100000000 error_msg String 请求响应描述 最小长度:0 最大长度:100000000 请求示例 POST https://IP:PORT/v1/external/incident/handle Request Headers: Content-Type:
安全 责任共担 身份认证与访问控制 审计与日志 服务韧性 认证证书