检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
件通知、变更通知和问题通知。 当产生事件单、问题单或有变更单时,通知规则会根据事件/问题/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通知模板为系统内置的,您可以根据您的场景选择通知模板。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
编辑应用拓扑 提供应用拓扑查看和编辑组件调用连线的能力。 操作场景 通过Cloud Operations Center查看应用拓扑和编辑组件调用连线。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,选择应用,单击。
配置完成后在事件处理页面进行事件降级需要审批,同时支持事件暂停。 图3 事件处理页面 1.事件降级和暂停审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 2.事件在已受理状态可进行升降级和暂停操作。 3.事件闭环之前需要将升降级和暂停的电子流闭环 4.事件升级无需审批 父主题: 事件流程
流程管理”页面,单击页面问题流程>问题审批,可配置问题降级和问题挂起的审批流程。系统默认问题降级和挂起需要创单人审批 图1 问题审批 单击“新建问题审批”配置问题降级或问题挂起的流程,选择问题流程、问题级别和审批配置。 图2 新建问题审批流程 配置完成后在问题处理页面进行问题单降级和问题单挂起。 图3 问题处理页面
填写演练任务基本信息,包括演练任务名称和期望恢复时长,单位为分钟。 图10 演练任务基本信息 选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”弹出“添加新的攻击任务”界面。 图11 选择攻击任务 添加新的攻击任务,可以选择创建攻击任务
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
参数仓库已选参数和已选主机实例不能跨Region? 安全生产规则,参数仓库已选参数和已选主机实例不允许跨Region操作,选择实例和参数仓库选择的区域需要一致。 图1 参数仓库 图2 选择实例 父主题: 参数管理常见问题
单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障模式和区域。并且可以对后续的演练任务进度进行跟踪。 图3 通过演练规划接单进入创建演练任务页面
需安装UniAgent主机的详细信息,必选项。 填写如下信息: 主机IP:主机的IP。 操作系统:主机的操作系统,Linux和Windows。 登录帐号:登录主机的帐号。当操作系统为LINUX时,建议使用root帐号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。
提供用户给对应机器资源执行UniAgent的安装、重装、升级和卸载操作。 操作场景 通过Cloud Operations Center给对应机器资源执行UniAgent的安装、重装、升级、卸载和状态同步操作。 注意事项 当前只有弹性云服务器(ECS)的实例支持UniAgent的操作。 操作系统使用限制
排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 场景描述:排班场景的详细说明。 角色名称:排班角色的名称。 排班场景:可选择当前已创建的排班场景。 角色描述:排班角色的详细说明。 排班方式 固定班次:对人员进行固定
问题描述:必填,具体描述问题现网和对现网的影响,支持上传附件 问题来源:非必填,填写问题来源,来源包含事件、告警、WarRoom和主动运维发现。若是处理事件发现的问题则选择事件。 问题发生时间:非必填,填写当前问题发生的时间 问题应用:必填,选择该问题的归属应用 问题级别:必填,选择
执行公共脚本 提供用户执行服务提供的公共脚本的能力。 公共脚本说明:COC提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘。 操作场景 通过Cloud Operations Center执行服务提供的公共脚本。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则