检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
true:表示演练处于取消正在注入故障的阶段时,会执行rollback()回滚函数中的内容 false:表示演练处于取消正在注入故障的阶段时,不会执行rollback()回滚函数 1. 在"inject_fault"函数中,请添加一个故障注入成功的标志,并于"check_fault_
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
展示批次详情 功能介绍 查询:批次详情,分页获取批次中的实例列表。 过滤条件:分页参数 URI GET /v1/job/script/orders/{execute_uuid}/batches/{batch_index} 表1 路径参数 参数 是否必选 参数类型 描述 batch_index
默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 选择需要修改的规则,单击操作列“修改”。
时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自execute
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。 是否通过:可选项“通过”、“不通过”。 验证描述:填写验证描述。限制长度0-300个字符。
在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。 表1 改进处理参数说明 参数 说明 问题原因 请填写问题发生的原因。 限制长度1-1000个字符。 改进措施 请填写详细的改进措施。 限制长度1-1000个字符。
钟。 图10 演练任务基本信息 选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”弹出“添加新的攻击任务”界面。 图11 选择攻击任务 添加新的攻击任务,可以选择创建攻击任务或者选择已有。之前没有创建过攻击任务,需要新建攻击任务,之前创建过攻击任务,可以选择已有。
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 - 分 0~59 * / 任务的执行间隔大于30分钟。
自动批准选择“批准指定日期之前发布的补丁”时必填。 合规性级别 未指定 重大 高 中 低 提示 符合该补丁基线的补丁在合规性报告中展示的等级。 包括非安全更新 - 不勾选“包括非安全更新”,在补丁修复时不会进行有漏洞的补丁升级。 补丁例外 - 已批准的补丁以及已拒绝补丁支持以下格式: 完整的软件包名称,格式为:example-1
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。 表1 定位出方案参数说明 参数 说明 问题应用 默认创建问题选择的应用。在下拉列表选择涉及问题的应用。 是否为共性问题 可选项“是”、“否”。 发现问题版本号 可选参数。请输入问题对应的版本号。
接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
EulerOS2.0 选择补丁的产品属性,在补丁扫描修复时将会过滤出该产品的补丁。 合规性报告 未指定 重大 高 中 低 提示 符合该补丁基线的补丁在合规性报告中展示的等级。 基线补丁 无 用户自定义基线补丁的版本以及发行版号,补丁扫描安装时将会以用户自定义的基线补丁作为是否合规判断依据。
操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,点“变更开始”。若变更方案关联的作业,需先执行作业;若是变更指导书,按照变更指导书步骤实施变更。 图1 变更实施 变更结束后,点“变更结束”,并填写变更结果。
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而
问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“现网实施”。 设置“现网实施”。 若区域涉及变更,点击操作列关联变更单并进行变更实施。变更单相关操作请参考变更中心。 若区域不涉及变更,点击操作列的“不涉及变更”。 支持添加区域和删除已有区域。