检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自定义预案 操作场景 如果云运维中心提供的公共预案不满足您的要求,可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 在“自定义预案”页签,单击右上方“创建应急预案”。
是 String 事件单号,示例:IM202403181322030178042608 最小长度:0 最大长度:255 operator 是 String 操作人ID,示例:00909e0a9c0a49a1b5e1c3eac362e3d7,可以在【基础配置】【人员管理】中查询到 最小长度:0
application/json X-Auth-Token: MI*******ghkgB Request Body: { "incident_num":"IM202403221515060171753781", "operator":"7da46971b7e24eed90cf777cc2ff8b91"
Content-Type: application/json X-Auth-Token: MI*******ghkgB { "incident_num":"IM202403221515060171753781", "operator":"7da46971b7e24eed90cf777cc2ff8b91"
模拟网卡down的情况,因各主机网络配置不同,网卡down后有可能启动网卡失败,请做好恢复网络的应急预案,不支持故障紧急终止 篡改DNS域名解析 篡改域名地址映射,支持故障紧急终止 端口占用 模拟系统网络端口被占用(最多100个),支持故障紧急终止 整机断网 模拟整机断网的情况,拒绝所有基于TCP
问题处理记录 操作场景 问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询处理记录。 处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题:
海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,
收藏企业项目 操作场景 资源管理提供了用户收藏企业项目的能力,可以通过企业项目筛选相关资源。当资源较多时,您可以选择已收藏的企业项目快速筛选出资源。 收藏企业项目 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。 点击右上方“收藏配置”。 设置“收藏配置”。
请求响应描述 最小长度:0 最大长度:100000000 请求示例 GET https://IP:PORT/v1/external/incident/IM2024******08 Request Headers: Content-Type: application/json X-Auth-Token:
处理告警 操作场景 当汇聚告警生成后,用户可以通过云运维中心快速处理,执行响应方案,支持作业、脚本两种方式。 注意事项 只有责任人可以处理当前告警。 处理告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。 选择需要处理的告警,单击操作列“更多
当汇聚告警生成后,会显示在当前告警页签。若告警已经处理完毕或由于其他原因需要清除,可以通过清除告警功能将汇聚告警从当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。
影响应用管理 操作场景 在故障发生时,若有应用受影响,用户可以在WarRoom详情中添加影响应用。对于影响应用,可以通过应用诊断检查应用详情,通过执行预案快速恢复应用。 新增影响应用 WarRoom在启动、故障定界和恢复阶段支持新增影响应用功能。 登录云运维中心。 在左侧导航栏选择“故障管理
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤 登录云运维中心。
本节介绍REST API请求的组成,并以调用IAM服务的获取用户Token来说明如何调用API,该API获取用户的Token,Token可以用于调用其他API时鉴权。 您还可以通过这个视频教程了解如何构造请求调用API:https://bbs.huaweicloud.com/videos/102987。
00000000", "error_msg": null, "data": { "incident_num": "IM202403221515060171753781" } } 父主题: 事件管理
创建产品 操作场景 产品底层基于Terraform或Json构成的云资源模板。根据Terraform及Json的定义,可以是单个云资源,也可以是多个云资源的组合。管理员可以通过入门示例模板或自定义模板创建产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCSe
演练规划 操作场景 您可以通过演练规划对故障模式进行排期,创建演练规划可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 创建演练规划 登录云运维中心。 在左侧导航栏选择“韧性中心
绑定产品组合 操作场景 产品可以绑定一个或多个产品组合。您可以根据需要为产品添加或移除产品组合。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 绑定产品组合 登录云运维中心。 在左侧导航栏选择“资源管理
如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的添加、修改、删除、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 添加SLO指标 登录云运维中心。 在左侧导航栏选择“基础配置 > SLO管理”。 选择需要配置的SLO指标,单击操作列“指标配置”。