检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
逐步内置故障模式300+; 支持多维度攻击场景,同时覆盖虚拟化和容器化; 支持攻击流程自定义编排,配套客户个性化业务场景; 前提条件 已在应用管理中创建应用分组; 进行混沌演练的资源已安装UniAgent; 步骤一:故障模式 确认演练目标主机或容器所属应用,事件级别是否正确。 登录COC。
在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 在应急预案列表的“操作”列,单击“删除”。 图12 应急预案列表 在弹框中单击“确认”,即可删除指定应急预案。 图13 删除应急预案 父主题: 应急预案
手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统
仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 testValue 关联APM环境 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 - 单击“创建”。 完成应用创建。 创建子应用 登录云运维中心。 在左侧导航栏选择“资源管理
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备
升降级 操作场景 创建人提交问题后,若问题处理人认为当前问题级别不合理,可对问题单进行升降级操作,问题单升降级流程可在流程管理中配置。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“升降级”。
String 原始告警URL 最小长度:0 最大长度:255 alarmStatus 否 String 告警状态。一般取值为alarm(告警中)和ok(已恢复) 最小长度:0 最大长度:255 枚举值: alarm ok alarmSource 是 String 告警源 最小长度:1
例,单击“UniAgent > 重装”或单击UniAent状态列"重新安装"。 图2 重装UniAgent 参数信息与安装UniAgent中参数基本一致,请参考设置“安装UniAgent”信息。 设置完成后,单击“提交”。 等待重装完成。 升级UniAgent 登录云运维中心。 在左侧导航栏选择“资源管理
当汇聚告警生成后,会显示在当前告警页签。若告警已经处理完毕或由于其他原因需要清除,可以通过清除告警功能将汇聚告警从当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。 操作步骤 登录云运维中心。
- 1000 total Long 总数 最小值:0 最大值:9223372036854775807 running_num Long 进行中warroom总数 最小值:0 最大值:9223372036854775807 closed_num Long 已关闭warroom总数 最小值:0