检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
tions重新授权,即可访问组织所有功能。 组织开通之后,跳转到组织管理页面,按照以下步骤创建组织: 1. 组织管理员需要创建一个组织,一个账号只能有一个组织; 2. 成员账号看不到除了控制面板外的东西; 3. 成员账号也必须是企业级账号; 授权COC为可信服务,请参见授权为可信服务。
期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。 多AZ容灾 COC支持跨AZ容灾,当一个AZ异常时,不影响COC实例持续提供服务。
SLA管理 SLA(服务等级协议,Service Level Agreement),SLA管理为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户跟进和处理,并记录工单SLA触发详情。 自定义SLA 公共SLA SLA记录 父主题: 基础配置
在小时这个域中使用,“*/3”等同于“每3个小时”,即“0,3,6,9,12,15,18,21”小时触发。 L 表示最后,只能出现在日和星期两个域 在星期这个域使用 5L,意味着在最后的一个星期四触发。 示例 0 15 10 ? * * 每天上午10:15执行任务; 0 0 10,14,16 * *
更新参数:需要操作类权限:coc:parameter:update 资源类权限(具体到某一个region下 && 某一个租户的一个参数):coc:*:*:parameter:name(第一个*代表所有regionID,第二个*所有租户,name代表参数名称) 资源类权限决定您可以
inc_type_p_shelter_issues 机房问题 shelter issues inc_type_p_monitoring_issues 监控问题 monitoring issues inc_type_p_consulting_issues 业务咨询类 consulting issues
执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“异常”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图2 选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。
作业管理 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。 执行公共作业
排班管理”页面,选择已创建的排班场景(排班场景名称后面会显示“应用排班+轮班班次(周一 -- 周日)”),区域和应用。 图6 应用轮班排班列表 区域可用来区分同一个应用在不同区域的排班。若您的业务和区域无关,您可以忽略区域。 单击“添加人员”,填写排班信息后,单击“确定”,可查看已添加的排班人员。
填写审批配置内容 1、填写基本信息 一次仅支持对一种变更类型配置,可同时对多个变更级别配置 2、审批配置 审批名称自动生成 审批人通过排班场景和排班角色决定 审批方式:一人通过 或 全部通过 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的
、successRate (成功率阈值(%)) 、commandContent (命令内容) 和commandParams (命令入参) 。 图7 添加输入信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图8 添加异常处理信息 单击“确定”,完成当前原子动作的配置。 父主题:
用。 排班场景概述 排班管理中可以设置多种排班,一个排班场景即是一种排班的集合。创建排班场景时,您需要选择对应的排班方式,排班维度。根据您的选择,后续设置排班的方式也会有所区别。 场景角色概述 场景角色是设置排班时的最小单位,一个排班场景中可以创建多个排班角色,在设置排班时可以对每个角色设置不同的值班人。
执行UniAgent操作 提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。
表示用于传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 指定承载REST服务端点的服务器域名或IP,不同服务不同区域的Endpoint不同,您可以从地区和终端节点获取。 例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。
执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“ 编辑标签”。 克隆:单击“克隆”,将跳转至执行作业,可按照执行自定义作业中的操作步骤再次执行该作业。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图1 作业工单 选择一个状态为“执行中”或“异常”或“已暂停”的作业
} ] } 示例2:拒绝用户删除文档 拒绝策略需要同时配合其他策略使用,否则没有实际作用。用户被授予的策略中,一个授权项的作用如果同时存在Allow和Deny,则遵循Deny优先。 如果您给用户授予COC FullAccess的系统策略,但不希望用户拥有COC Full
路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 请求参数 无 响应参数 状态码: 200 表2 响应Body参数
原子动作 原子动作定义了一个具体的操作内容,是作业的最小单位。 执行API 等待API结果 执行内容 父主题: 作业管理