检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
WarRoom启动后,可以添加新的受影响的应用,本节介绍如何新增WarRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 场景描述:排班场景的详细说明。 角色名称:排班角色的名称。 排班场景:可选择当前已创建的排班场景。 角色描述:排班角色的详细说明。 排班方式 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。
创建账号 提供用户根据不同的云厂商创建账号的能力,用于同步该账号下在该云厂商下的资源。 操作场景 通过Cloud Operations Center创建云厂商账号。 注意事项 目前仅支持创建阿里云厂商的账号。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
约束与限制 更详细的限制请参见具体API的说明。 父主题: 使用前必读
补丁基线提供了用户可以自定义扫描以及安装的规则的能力,通过自定义补丁基线,补丁扫描安装时会通过用户所设置的补丁基线进行补丁的过滤筛选,扫描或者修复符合基线的补丁。 补丁基线拥有ECS、CCE以及BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 Cloud Operations
查看容量排名 提供用户查看已关联的资源容量排名的能力。 操作场景 通过Cloud Operations Center查看已关联的资源容量排名。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,单击“容量”。 图1
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
提供用户查看安全云脑的安全监控信息的能力。 操作场景 通过Cloud Operations Center查看安全云脑的安全监控信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看安全云脑的安全监控信息。 图1 安全云脑监控信息 单击“自定义看板”,设置可显示的图表。 图2 自定义安全云脑的安全监控信息
华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
选择一个状态为“异常”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图2 选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图4 选择执行中的脚本工单
通知管理”页面,选择需要编辑的通知,在列表中的“操作”列单击对应的“编辑”,参考创建通知的步骤3进行编辑和保存。 图3 编辑通知 删除通知 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,选择需要删除的通知,在列表中的“操作”列单击对应的“删除”, 图4 删除通知
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
关联组件,关联的组件后期都以该帐号基线来纳管主机。 图2 基线信息录入 主机的某个帐号能被成功纳管有三个前提条件: 1、安装UniAgent且UniAgent的状态为运行中。 2、主机状态为运行中。 3、主机中存在基线中配置的帐号且帐号可登录。 为了确保组件下新增的主机实例能被自
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
事件历史记录 操作场景 可以查看事件的历史记录,包含事件的整个处理过程。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件页面详情 单击“ 事件历史”查看事件历史记录。 图2 查看事件历史记录
当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“转事件”或“批量转事件”。 相同区域的告警才能批量转事件。 输入事件相关信息,单击“确定” 图1 告警转事件 事件的参数说明,参考创建事件。 父主题: 汇聚告警
查看资源详情 提供用户查看资源详情的操作。 操作场景 通过Cloud Operations Center查看已关联应用的资源详情。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,在“弹性云服务器ECS”模块