检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
待审批 APPROVED:正常(审批通过) REJECTED:驳回(审批人,驳回该脚本 枚举值: PENDING_APPROVE APPROVED REJECTED gmt_created Long 创建时间 最小值:1 最大值:9223372036854775807 gmt_modified
操作场景 您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤 登录COC。
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的
关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理用户指南》。 父主题: 使用前必读
图2 发起PRR评审-填写基础信息 表1 发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类
运维概览 操作场景 通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。
是 Array of strings 影响应用id 最小长度:1 最大长度:255 数组长度:1 - 1000 incident_number 是 String 事件单号 最小长度:1 最大长度:255 schedule_group 是 Array of ScheduleGroupInfo
4、变更应用:先选择顶层应用,再选择下层具体的应用范围。 5、变更区域:变更区域和变更应用相结合定义变更范围。 6、变更计划:以region为维度生成。 需要按region配置实施人&配合人; 需要按region配置计划变更时间窗(注:允许变更时间窗受变更级别&变更类型限制)。
图4 应用固定排班列表 单击列表“操作”列的“编辑”,输入用户名,单击“确定”,可在排班页面查看已添加人员的排班。 图5 应用固定排班添加人员 应用排班+轮班场景 使用场景:适用不同应用按照轮班的班次进行排班。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。
Array of impacted_application objects 影响应用 数组长度:0 - 1000 processing_duration Long 处理时长(分钟) 最小值:0 最大值:9223372036854775807 restoration_duration
前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,单击“创建事件单”,进入“创建事件单”页面。 图1 事件单列表 填写事件单基本信息后,单击“提交”。
故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
图3 填写WarRoom信息 若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信和钉钉),需要配置以下信息: (1)在移动应用管理中配置对应用。 (2)在人员管理中配置企业微信对应邮箱。
是 String 应用id 最小长度:1 最大长度:255 resourceName 否 String 资源名称 最小长度:0 最大长度:255 resourceId 否 String 资源ID 最小长度:0 最大长度:255 alarmDesc 是 String 告警描述 最小长度
查看告警 操作场景 通过云运维中心查看汇聚告警发生时间、收敛数量、所属应用、告警等级等汇聚告警相关信息。 并可以通过搜索框查看符合搜素条件的汇聚告警相关信息。 操作步骤 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。
- √ x x x 深度诊断 coc:application:GetDiagnosisTaskDetails 查询应用资源诊断任务的权限。
概述 云运维中心支持对弹性云服务器 ECS、云数据库 RDS、Flexus应用服务器L实例、裸金属服务器 BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。
(月度SLO实际值); 多个区域单应用SLO实际值=min(月度SLO实际值); 多个区域多应用SLO实际值=avg(多个区域单应用SLO实际值); 天/月 百分比 应用维度SLO统计 应用SLO统计 SLO管理 统计应用维度的SLO情况 按照应用维度,展示月度SLO实际值; 月度
图3 全局轮班场景清空人员 应用排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景、区域及应用,单击“操作”列的“编辑”可增加或删除排班人员。 图4 应用固定场景修改人员 应用排班+轮班班次 登录COC。
100000000 error_msg String 请求响应描述 最小长度:0 最大长度:100000000 请求示例 GET https://IP:PORT/v1/external/incident/handle Request Headers: Content-Type: application