检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过Cloud Operations Center查看资源拓扑关系。 注意事项 目前仅支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)以上四种资源的拓扑关系。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用
演练任务。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud
步骤二:安装UniAgent 在“资源管理”页面,勾选目标弹性云服务器,选择“UniAgent>安装”,进入安装UniAgent页面。 图2 安装UniAgent 单击 “手动安装”,进入手动安装UniAgent页面。 图3 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
资源总览 提供用户查看所购买资源(包含弹性云服务器、弹性公网IP、云数据库等)的能力。 操作场景 通过Cloud Operations Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1
CS弹性云服务器,为解决多云之间网络互通。 - 安装机 安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置: 单击对应的下拉框,选择“设置安装机”。 进入AOM服务进行安装机配置。 - 需安装UniAgent主机 需安装UniAgent主机的详细信息,必选项。
代理区域是对代理机的分类管理;代理机是指在华为云购买和配置一台华为云弹性云服务器ECS,为解决多云之间网络互通。 - 安装机 安装机是远程安装方式下命令的执行机,必选项。 如果没有配置安装机,按如下步骤进行配置: 单击对应的下拉框,选择“设置安装机”。 进入AOM服务进行安装机配置。 - 需安装UniAgent主机
通过Cloud Operations Center BMS操作批量重装功能进行BMS实例操作系统批量重装。 注意事项 已开机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量BMS操作”模块中单击“重装操作系统”,进入“重装操作系统”页面。
同步资源 提供用户同步资源的能力,资源数据支持页面的条件过滤及字段显示控制。 资源:用户可以在云平台上使用的一种实体。例如:弹性云服务器(ECS)实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权
选择攻击目标为云容器引擎 (CCE),指定pod 图15 选择攻击目标为云容器引擎 (CCE),指定数量 选择云容器引擎 (CCE)攻击场景并填写场景的攻击参数,单击“完成”即可。场景包括Pod资源类、Pod进程类、Pod网络类。 图16 云容器引擎 (CCE)攻击场景 如果添加新的
ecs:cloudServers:stop 资源运维中批量关闭云服务器 批量重启云服务器 ecs:cloudServers:reboot 资源运维中批量重启云服务器 批量启动云服务器 ecs:cloudServers:start 资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS
Center ECS操作批量重装操作系统功能进行ECS实例批量重装。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击
t; ecs:cloudServers:rebuild; ecs:cloudServers:changeOS; ecs:cloudServers:showServer; ecs:cloudServers:stop; ecs:cloudServers:reboot; ecs:cloudServers:start;
Center ECS操作批量切换操作系统功能进行ECS实例批量切换系统。 注意事项 如果存在未关机的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单
coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop
COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器L实例(HCSS)两种攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 以下是BMS、HCSS各镜像版本与支持的探针类武器声明:
运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。 操作流程 操作步骤
通过Cloud Operations Center ECS操作批量重启功能进行ECS实例批量重启。 注意事项 已关机的实例无法被选中。 操作步骤 登录COC。 在左侧菜单栏中选择“资源运维”,选择 “资源批量操作”,在“批量ECS操作”模块中单击“批量重启”,进入“批量重启”页面。
通过指定攻击目标中的主机、监控的指标名称、指标的上下限区间值,配置监控任务。 图6 弹性云服务器(ECS)攻击场景演练监控配置 如果选择攻击目标来源为云容器引擎 (CCE),则需要选择应用、选择pods(依次选择集群、namespace、工作负载类型、工作负载),可以指定pod或者指定数量(指定数量时,将执行
管理中已配置的仪表盘可以在云运维中心中进行展示。故障管理中,支持接入应用运维管理服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警 演练监控 弹性云服务器 资源运维中,可以对弹性云服务器进行批量操
排班管理 排班角色 单个排班场景下的排班角色≤10个。 帐号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(帐号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 帐号基线 基线帐号数量≤30个,关联的组件数量≤100个。