检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行
单击列表数据中的“待办名称”,进入到“待办详情”,单击右上角的“受理”,即可完成受理。 图8 受理待办 当前登录人只能受理责任人为自己的待办。 取消待办 登录COC。 在左侧导航树选择“任务管理 > 待办中心”页面,选择“我创建的”页签,进入我创建的待办列表。 单击列表数据中的“待办名称”,进入“待办详情”页面。
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称 自定义设备的名称。 测试设备 私有IP 虚拟机私有IP。 192.168.1.1 操作系统 在下拉框选择操作系统。 LINUX UniAgent Id 可选参数。UniAgent唯一标识。 - Ecs Id 可选参数。Openstack生成的唯一标识。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应
使用场景:适用不同应用,排班人员是全天固定的。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择已创建的排班场景(排班场景名称后面会显示“应用排班+固定班次”),区域和应用。 图4 应用固定排班列表 单击列表“操作”列的“编辑”,输入
可选参数。对应用进行描述。 - 子应用名称 仅应用结构类型选择大型应用时需要设置。 根据命名规则,自定义子应用的名称。 测试子应用 子应用描述 可选参数。对子应用进行描述。 - 组件名称 根据命名规则,自定义组件的名称。 测试组件 分组名称 根据命名规则,自定义分组的名称。 测试分组 云厂商 请选择目标实例所在云厂商。
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
最大长度:512 请求示例 查询ECS报告下不合规的报告列表 /v1/patch/instance/compliant?offset=1&limit=10&compliant_status=non_compliant&report_scene=ECS 响应示例 状态码: 200 节点合规性报告信息
"${目标组织管理员租户的租户ID}" ], 点击右下角的“确定”按钮,信任策略编辑完成,继续点击页面右下角的“确定”按钮,执行账户信任COC同时信任组织管理员的委托即创建完成。 图19 编辑执行租户委托的信任策略2 图20 编辑执行租户委托的信任策略3 组织管理员委托和执行账号
示例 说明 基线名称 测试基线 根据命名规则,自定义基线的名称。 基线类型 组件基线 参数不支持修改,账号基线的类型。 基线账号 账号类型 Linux 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 账号名称 root 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。
单击“添加标签”。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键允许包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值允许包含任意语种字母、数字、空格和_ . : / =
比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。
单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值可以包含任意语种字母、数字、空格和_ .
云运维中心提供应用能力对资源进行分组管理,用于管理云服务对象与应用之间的关系,包含华为云、友商云核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。层次结构遵循“应用 + 子应用(可选)+ 组件 + 分组”的应用管理模型。 父主题: 应用管理
参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择
邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据与资源,支持的跨账号管理的功能有运维态势感知、资源管理和作业管理。 父主题: 开通云运维中心并授权使用
新增流转规则 若两个流转规则中的信息较相似,可单击“操作”列“复制”,快速创建流转规则。 根据页面提示,输入规则名称、应用名称等基本信息。 图2 填写流转规则基本信息 在触发规则部分,选择触发类型,选择触发规则的数据源,根据相应的数据源的字段的键,配置相应的条件及满足条件的值,并选择级别。 图3
批量ECS资源切换镜像报错如何处理? 工单执行报错"code":"Ecs.0021","message":"Failed to check Cinder quotas because the number of Gigabytes exceeded the upper limit