检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
进展通告 操作场景 进展通告在故障发生或处理过程将故障处理进展及时同步给相关人员,关注该故障的人可快速掌握故障进展。 进展通告 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“更新通告”。 设置“更新实时通报内容”。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 启用/禁用公共SLA 登录云运维中心。 在左侧导航栏选择“基础配置 > SLA管理”。 单击上方“公共SLA”。 选择需要启用/禁用的公共SLA,单击操作列“启用/禁用”。 单击“确定”。
批量重装操作系统 操作场景 云运维中心提供了统一操作FlexusL实例的功能。通过批量FlexusL重装操作系统功能,您可以对FlexusL实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
批量重装操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重装操作系统功能,您可以对ECS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁管
源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器(ECS) √ √ √ √ √ √ 云数据库(RDS)
代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升
集成自建监控系统告警。 告警管理数据,当前支持POST方式集成,具体参考自建监控系统上报告警。 验证集成是否成功。 在左侧导航栏选择“故障管理 > 集成管理”,在“已集成”中查看到应用运维管理监控源状态为“已接收报警”则说明已集成成功。 自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。
批量切换操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS切换操作系统功能,您可以对ECS实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量切换操作系统 操作场景 云运维中心提供了统一操作FlexusL实例的功能。通过批量FlexusL切换操作系统功能,您可以对FlexusL实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 新建事件类别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件类别”。 单击“新建事件类别”。 表1
请填写当前问题类型对应中文环境的详细描述。 描述-英文 请填写当前问题类型对应英文环境的详细描述。 单击“确定”。 完成问题类型创建。 修改问题类型 系统预设问题类型不可修改。 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“问题流程 > 问题类型”。 选择需要修改的问题类型,单击操作列“修改”。
变更场景 操作场景 变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 开启/关闭变更场景 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“变更场景”。 选择需要开启/关闭的变更场景,单击是否开启列开关。 调整变更场景的开启/关闭状态,关闭后会取消当前变更场景。
请填写设备厂家。 华为 操作系统 在下拉列表选择操作系统。 LINUX 描述 可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称 自定义设备的名称。 测试设备 私有IP 虚拟机私有IP。 192.168.1.1 操作系统 在下拉列表选择操作系统。 LINUX UniAgent
提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息。 选择PRR检查项,单击“添加检查项”,可选项“从系统中选择”、“自定义添加”,可以同时使用“从系统中选择”和“自定义添加”设置检查大类。 从系统中选择:选择云运维中心提供的预定义检查项,支持多选。选择完成后展开检查项,可以添加指标。 自