云服务器内容精选

  • 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性 云服务器ECS 进行CPU使用率加压的故障演练。
  • 操作流程 操作步骤 说明 准备工作 注册华为账号 并实名认证,开通云运维中心。 步骤一:同步资源 获取当前用户所属的所有Region下资源数据并同步至云运维中心。 步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 步骤三:创建演练任务 针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 步骤四:启动演练 按照已经创建的演练任务,自动化的故障注入。
  • 人员管理概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从 IAM 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续 消息通知 的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅但未确认订阅;黑色:用户已订阅且已确认订阅。 父主题: 人员管理
  • 镜像与武器版本支持声明 COC混沌演练新增了裸金属服务器(BMS)和Flexus应用服务器 L实例 (H CSS )两种攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 以下是BMS、H CS S各镜像版本与支持的探针类武器声明: CentOS 6.10镜像及以下版本,因系统缺少探针包运行所必要的共享库(GLIBC_2.14和GLIBCXX_3.4.15)不支持探针类武器。 BMS各镜像版本支持的探针类武器如表1所示。 表1 裸金属服务器镜像与武器兼容性列表 武器 支持的镜像版本 资源类武器 CPU使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 内存使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 磁盘使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 磁盘IO加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 进程号耗尽 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 杀进程/持续杀进程 CentOS 7.4、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络类武器 网络延迟 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络丢包 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络错包 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络包重复 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络包乱序 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络中断 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网卡down CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 HCSS各镜像版本支持的探针类武器如表2所示。 表2 Flexus应用服务器L实例镜像与武器兼容性列表 武器 支持的镜像版本 资源类武器 CPU使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 内存使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 磁盘使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 磁盘IO加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 进程号耗尽 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 杀进程/持续杀进程 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络类武器 网络延迟 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络丢包 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络错包 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络包重复 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络包乱序 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络中断 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网卡down CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0
  • 问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理
  • 自动化执行参数示例说明 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,相关示例如下: 参考示例: 告警信息如下: { "alarmId": "al1696664837170EWbvx24kW", "alarmName": "alarm-4z39coctest1007", ...... "URL": "https://console.ulanqab.huawei.com/ces/?region=cn-north-7#/alarms/detail?alarmId=al16849986549022X5Vp4pxr", "additional": { "dimension": "instance_id:29d99a09-2d15-4ced-8723-6e94ae1c1472", ...... }, ...... } 1. 如果要获取当前告警信息里面的alarmId的值,表达式写成如下形式: ${currentAlarm.alarmId} 2. 如果要从additional.dimension字符串里面获取instance_id的uuid,表达式写成如下形式: ${string.substring(currentAlarm.additional.dimension, string.indexOf(currentAlarm.additional.dimension, 'instance_id:') + 12)} 或者 ${string.substring(currentAlarm.additional.dimension, 12)} 3. 如果要从URL字符串里面获取cn-north-7这个region ID,表达式写成如下形式: ${string.substring(currentAlarm.URL, string.indexOf(currentAlarm.URL, 'region=') + 7, string.indexOf(currentAlarm.URL, '#/alarms'))} 表达式里面的"currentAlarm."是个固定前缀,意思是从当前告警的数据里面获取。
  • 事件流程 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件级暂停功能,可参考基础配置-事件流程 图1 事件流程图 父主题: 事件管理
  • 获取帐号密码 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并已绑定应用的主机。 图1 帐号管理概览 若用户只想托管(只保存作用,不改密)主机帐号密码,可通过“导入帐号”的形式,下载Excel模板填写资源相关信息,确认信息无误后上传。 图2 导入托管帐号 1、导入形式的ECS资源帐号密码不参与纳管改密,若想对导入的帐号进行自动纳管,可以编辑全局基线或者创建帐号基线来添加对应帐号,则系统会对这些主机帐号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,帐号密码无法完成自动纳管改密。 若用户在OS上新增了主机帐号,在帐号管理页面勾选对应主机后,可通过“同步帐号”按钮一键同步新增的OS帐号。注意:若想新增的帐号参与纳管改密,还需在帐号基线中配置该帐号。 图3 同步OS帐号 当前帐号管理只支持单个主机的帐号密码查询,成功“获取帐号密码”的前提是主机帐号“改密状态”为“成功”或“改密失败原因”为“导入的帐号不参与改密”,可在“操作”列单击“查看帐号密码”确认资源改密状态。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 1、主机资源状态为“运行中” 2、主机的UniAgent状态为“运行中” 3、主机OS上的帐号与所绑定的帐号基线中的帐号一致 增量的ECS主机改密条件: 1、改密策略已开启 已纳管的主机定期改密条件: 1、已绑定改密任务 图4 主机改密详情 用户可在资源视角/应用视角下通过条件搜索需要提权的资源,在“操作”列单击“查看帐号密码”后“获取帐号密码”。 图5 获取帐号密码 若资源视角下,主机改密详情无数据,优先确认主机是否挂组件。若主机已挂组件,请先确认是否已绑定组件基线或者组件维度的自动纳管策略为开启状态;若主机未挂组件,请先确认全局维度的自动纳管策略是否为开启状态。
  • 配置改密区域 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密任务”页签,配置需要开启定期改密的区域。单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完成,可至“帐号管理”页签“查询帐号密码”。
  • 开启改密策略 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密策略”页签,根据业务需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件
  • 配置密钥 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 在页面右上角点击“密钥管理”按钮,或者通过“帐号管理流程引导”标签下方的“配置密钥”下“立即配置”按钮。 图1 配置密钥 进入“密钥管理”页面,单击“绑定密钥”,右滑出现选择密钥页面,选择需要绑定的密钥。若当前无可用密钥,单击“新建密钥”,跳转DEW服务创建密钥,新建后刷新表格即可选择。单击“确定”。 图2 绑定密钥 在“确认绑定”弹框中,提示绑定的密钥一经使用则不支持更新密钥,单击“确认”。 图3 确认绑定提示 确认绑定风险后,则密钥创建和配置相关工作即完成,若有更新密钥的需求,单击“更新”。 图4 完成密钥绑定
  • 特殊字符含义 表2 Cron表达式特殊字符含义 字符 含义 示例 * 表示匹配域的任意值 在分这个域使用 *,即表示每分钟都会触发事件。 ? 表示匹配域的任意值,但只能用在日期和星期两个域,因为这两个域会相互影响。 要在每月的 20 号触发调度,不管每个月的 20 号是星期几,则只能使用如下写法:13 13 15 20 * ?。其中,因为日期域已经指定了 20 号,最后一位星期域只能用 ?,不能使用 *。如果最后一位使用 *,则表示不管星期几都会触发,与日期域的 20 号相斥,此时表达式不正确。 - 表示起止范围 在小时这个域使用 8-10,表示从 8时到 10 时每小时触发一次。 / 表示起始时间开始触发,然后每隔固定时间触发一次 在小时这个域中使用,“*/3”等同于“每3个小时”,即“0,3,6,9,12,15,18,21”小时触发。 L 表示最后,只能出现在日和星期两个域 在星期这个域使用 5L,意味着在最后的一个星期四触发。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,点击,选择“执行命令”。 图5 添加任务 填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择commandType (命令类型) :SHELL、PYTHON或BAT。设置executeUser (命令执行用户)、timeout (命令执行超时时长(秒)) 、successRate (成功率阈值(%)) 、commandContent (命令内容) 和commandParams (命令入参) 。 图7 添加输入信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图8 添加异常处理信息 单击“确定”,完成当前原子动作的配置。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,点击,选择“等待API结果”。 图5 添加任务 填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ShowBackupPolicy(查询自动备份策略)OpenAPI,显示具体的OpenAPI定义。 填写“propertySelector (检查资源属性) ”,指定需要作为判定条件的响应字段。按需配置判断条件: stopRetryValues (终止任务等待及API重试标识) :终止当前原子动作等待的标识; desiredValues (期望匹配成功标识) :期望值,当propertySelector与当前值相同时,认为当前原子动作执行成功; notDesiredValues (期望非匹配成功标识) :期望非匹配值,当propertySelector与当前值相同时,认为当前原子动作执行失败。 图7 添加输入信息 单击“输出”,按需配置输出内容,如将接口响应的backup_policy作为String类型的参数,命名为outputValue。如无需要,则无需添加参数。 图8 添加输出信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图9 添加异常处理信息 单击“确定”,完成当前原子动作的配置。
  • 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。 图3 填写作业基本信息 选择作业模板,如果没有合适的模板,选择“自定义”,单击“下一步”。 图4 选择作业模板 进行作业编排,单击“添加任务”,选择基本信息,单击,选择“执行API”。 图5 添加任务 填写任务名称,操作描述。 图6 填写基本信息 单击“输入”,按需选择service(产品短名)、apiName(api名称),如选择云数据库的ListSlowLogsNew(查询数据库慢日志)OpenAPI,显示具体的OpenAPI定义。 填写所需OpenAPI参数内容。 图7 添加输入信息 单击“输出”,按需配置输出内容,如将接口响应的slow_log_list作为String类型的参数,命名为outputValue。如无需要,则无需添加参数。 图8 添加输出信息 单击“异常处理”,配置执行出现错误后的行为:终止整个作业或执行下一个步骤。 图9 添加异常处理 单击“确定”,完成当前原子动作的配置。