检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
容器:通过对主机或集群注入网络故障,验证服务的容灾能力,如链路层网络丢包、网络时延、闪断等。 业务和数据:用于模拟数据库或文件的异常导致的业务异常,如数据库表删除、数据库不可用等。 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。 严重程度默认“P1”最严重,“P5”最轻微。
企业项目 在下拉列表中选择脚本归属的企业项目。 default 脚本版本号 请自定义填写脚本版本号。 1.0.0 风险等级 可选项“高”、“中”、“低”,请根据实际情况选择风险等级。 高 脚本描述 对脚本进行描述。 - 设置“脚本内容”。 脚本类型:可选择脚本类型“Shell”、“Python”、“Bat”。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。
删除产品 操作场景 您可以删除已不再使用的产品。需要注意的是,如果产品已经绑定到产品组合,您需要先在产品组合移除产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品 登录云运维中心。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
删除组件 操作场景 组件创建后,若想删除组件,请按如下操作进行。 注意事项 当组件下存在分组时,此组件无法删除。必须保证节点下为空才可以删除。 删除组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要删除的组件,单击。
能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义SLA,或使用COC预置的公共SLA规则。 支持事件单/告警单/待办任务/问题单4类工单。 支持设定SLA目标(工单需要在指定时间内完结某状态),当工单
COC于2024年7月31日在中国站、国际站转商,转商后COC本身的基础功能免费,若后续部分高阶产品能力开始收费,提前30天通知。 云运维中心与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。
应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 修改拓扑仅支持修改组件之间的连线关系。 修改拓扑不影响应用和组件的层级和功能。 查看和修改拓扑 登录云运维中心。
可选项“成功”、“失败”。 变更验证 可选项“变更时间窗内可验证”、“变更时间窗内不可验证”。 验证报告或验证说明 单击“添加文件”上传验证报告或验证说明相关文件。 支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,单个文件大小不能超过10MB。 备注
转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 创建事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击右上方“创建事件单”。
同步资源 操作场景 当资源数据未正常展示时,通过同步资源进行手动更新资源数据,保证数据实时可靠。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources
资源看板 操作场景 您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源
若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故障恢复情
提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息。 选择PRR检查项,单击“添加检查项”,可选项“从系统中选择”、“自定义添加”,可以同时使用“从系统中选择”和“自定义添加”设置检查大类。 从系统中选择:选择云运维中心提供的预定义检查项,支持多选。选择完成后展开检查项,可以添加指标。
String 原始告警URL 最小长度:0 最大长度:255 alarmStatus 否 String 告警状态。一般取值为alarm(告警中)和ok(已恢复) 最小长度:0 最大长度:255 枚举值: alarm ok alarmSource 是 String 告警源 最小长度:1
删除应用 操作场景 应用创建后,若想删除应用或子应用,请按如下操作进行。 注意事项 当应用或子应用下存在分组、组件或子应用时,此应用或子应用无法删除。必须保证节点下为空才可以删除。 删除应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。