检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
创建定时任务 操作场景 您可以通过定时运维功能对目标实例定时自动执行脚本或作业,提高运维自动化率。 操作路径:资源运维->自动化运维->定时运维->创建定时任务。 创建定时任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。
执行公共作业 操作场景 公共作业是云运维中心提供的预定义作业,用户对公共作业具有只读和执行权限,作业管理提供基础的公共作业列表,支持在目标资源执行公共作业。 注意事项 在执行公共作业前需要确认是否拥有目标实例的资源权限。 执行公共作业 登录云运维中心。 在左侧导航栏选择“资源管理
演练任务 操作场景 演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对