检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
查询实例详情 操作场景 生成的云产品实例,可以在服务目录下查看详情,包括实例的基本信息、生成实例的日志事件和资源详情。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 查询实例详情
查看账号密码:用户可以查看在线托管资源和已开启改密策略资源的账号密码。注意:只有正常态的改密状态和导入的账号能获取到账号密码。 重置密码:重置密码会重置主机下所有“改密状态”为正常的账号的密码(导入的账号除外)且不可逆,重置后可在“查看账号密码”中查看重置密码结果。 导入账号 1、导入形式的ECS资源账号密码不参与
演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后的复盘改进,确保系统在各种压力下的表现行为能够确定优化策略。
若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。 变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。 优先按变更计划开始时间早的排前面 。 计划开始时间相同,按创建开始时间排序。 父主题: 变更管理
每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费,也降低了人工操作导致的遗漏等风险。
删除产品组合 操作场景 您可以删除已不再使用的产品组合。需要注意的是,在删除产品组合之前,您需要先移除产品组合中的所有产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品组合
创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
服务目录”。 单击“产品组合管理 > 我创建的产品”。 选择需要修改的产品,单击操作列“修改”。 设置“编辑产品”。 表1 编辑产品参数说明 参数 说明 名称 根据命名规则,自定义产品的名称。 创建人 产品的创建人。 描述 可选参数,请填写产品的详细说明。 单击"确定"。 完成产品修改。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
云运维中心支持通过账号管理免密登录主机(当前仅支持ECS的linux主机)。可以通过免密登录选择账号进入命令执行页面,账号来源于账号基线中配置的账号且OS主机存在的账号。 注意事项 主机可以成功远程登录的前提条件。 安装UniAgent且UniAgent的状态为运行中并UniAgent的版本需要大于1.1.3.8。
新用户首次登录云运维中心 COC,由于COC提供了对云服务资源的自动化运维、故障管理等能力,需要获得访问其他云服务的委托权限。COC需要创建名为ServiceLinkedAgencyForCOC和ServiceAgencyForCOC的委托。委托包含的权限可见表1以及表2。 图1 开通COC 表1
删除产品 操作场景 您可以删除已不再使用的产品。需要注意的是,如果产品已经绑定到产品组合,您需要先在产品组合移除产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 删除产品 登录云运维中心。
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
根据业务需要,您可以通过云运维中心进行策略设置,确保您新增的主机实例也能被定期改密。 改密策略分为全局基线和组件基线。 全局基线改密策略:开启全局维度的改密策略后,所有未绑定组件的增量主机实例将会被定期改密。 组件基线改密策略:开启组件维度的改密策略后,所有被选中的组件下的增量主机实例将会被定期改密。 若
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)