检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud
https://iam.cn-north-1.myhuaweicloud.com/v3/auth/projects Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs
实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性
分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户开通云审计服务并创建和配置追踪器后,CTS可记录与云运维中心服务相关的操作事件。
配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配起会规则的区域、应用、事件级别,会将加入群组的人加入到warroom会议和创建的移动应用中。 修改起会规则 登录云运维中心。
勾选需要选择的组织单元。 组织单元是账号的容器,使您能够对账号进行分组管理,并根据业务要求应用策略。 选择资源 勾选需要选择的资源类型。 单击“提交”。 完成视图创建。 编辑视图 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击筛选框上方“跨账号资源”。 单击筛选框右上方 “视图管理”。
IDC离线资源仅支持查看虚拟机资源详情。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要查看资源所在的云厂商。 默认选择“华为云”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击实例名称。 单击下方的“查看资源详情”。 进入对应资源服务详情页面。
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响S
自定义流转规则的名称。 区域 可选参数,在下拉列表选择区域。 不选择区域展示“默认”,表示不涉及区域。 企业项目 在下拉列表选择企业项目。 应用 在下拉列表选择应用。 设置“触发规则”。 表2 触发规则参数说明 参数 说明 触发类型 可选项“事件”、“告警”。 事件:生成事件单,需要值班人员尽快处理,持续跟进直至闭环。
中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。 本章节介绍如何通过云运维中心操作一台ECS执行重启作业。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
可选参数。在下拉列表选择WarRoom区域。可以选择多个区域。 企业项目 在下拉列表中选择企业项目。 应用 在下拉列表选择影响应用。可以选择多个应用。 创建群组方式 可选项“企业微信”、“钉钉”、“飞书”。 请先在移动应用管理配置应用通知方式,选择后WarRoom拉起会将排班人员和参与者拉入对应的群组中。 排班
演练监控 应用运维管理 总览页面中支持查看应用监控看板,在应用运维管理中已配置的仪表盘可以在云运维中心中进行展示。故障管理中,支持接入应用运维管理服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警
若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故障恢
在下拉列表中选择企业项目,支持选择“全部”。 全部 视图类型 请选择视图类型。 CMDB资源视角:以资源视角选择实例列表。 CMDB应用视角:以应用视角选择实例列表。 CMDB资源视角 资源类型 默认参数,不支持修改。 ECS 区域 在下拉列表中选择区域。 华北-北京一 目标实例
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的
在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。 默认选择“弹性云服务器ECS”。 单击“导入账号”,设置“导入账号”。
单击“关联单号”,选择对应工单。 发生时间 可选参数。请填写问题发生的时间。 问题应用 在下拉列表选择涉及问题的应用。 问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。
在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。 默认选择“弹性云服务器ECS”。 单击操作列“免密登录”。 在下拉列表选择需要登录的账号,单击“确定”。
操作场景 当资源数据未正常展示时,通过同步资源进行手动更新资源数据,保证数据实时可靠。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。