云服务器内容精选

  • SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义SLA,或使用COC预置的公共SLA规则。 支持事件单/告警单/待办任务/问题单4类工单。 支持设定SLA目标(工单需要在指定时间内完结某状态),当工单触发规则后,按指定方式通知指定的人员,且支持持续通知。 支持设定SLA预警目标,即将打破SLA时,提前指定时间发送通知。 支持查看SLA记录,包含工单ID,SLA状态,SLA规则等关键信息。 创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。 自定义SLA优先级高于公共SLA,部分应用优先级高于全部应用。 父主题: SLA管理
  • 概述 变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 变更管控:是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。 父主题: 变更管理
  • 前提条件 开启变更管控需要申请 IAM 权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:permissions:grantRoleToAgency", "iam:permissions:grantRoleToAgencyOnDomain", "iam:roles:createRole", "iam:groups:listGroups", "iam:permissions:listRoleAssignments", "iam:permissions:grantRoleToGroupOnDomain", "iam:permissions:revokeRoleFromGroupOnDomain", "iam:permissions:revokeRoleFromGroupOnDomain", "iam:roles:deleteRole", "iam:roles:updateRole" IAM v5版本权限:(IAM的新版本页面中 身份策略 添加action) "iam:policies:createV5", "iam:policies:listV5", "iam:groups:attachPolicyV5", "iam:groups:detachPolicyV5", "iam:policies:deleteV5", "iam:policies:listVersionsV5", "iam:policies:createVersionV5", "iam:policies:deleteVersionV5"
  • 注意事项 1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。 4、工单提权时校验操作的资源region、应用和工单状态,若操作的资源无所属region、应用,则不校验,会显示该用户名下所有的工单。每种该工单的状态校验如下: 事件单状态校验: (1)P1、P2、P3、P4已受理状态的事件单; (2)提权应用必需与事件单分析处理阶段的当前责任应用一致; (3)提权操作人必需与事件分析处理阶段的当前责任人一致; (4)提权区域必需与事件单的区域一致。 Warroom状态校验: (1)warroom的状态为(启动warroom、故障界定); (2)提权应用在warroom的影响应用列表中; (3)提权操作人是warroom的恢复责任人、恢复成员、管理员。 变更单状态校验: (1)提权应用,Region必须与变更单中的一致; (2)此次提权的操作人必须是变更单的实施人; (3)当前操作时间必须在变更单的计划实施时间窗内(当前操作时间必须大于计划开始时间且小于计划结束时间); (4)变更单必须点击【变更开始】 开启工单提权后,北向接口无法使用。例如执行脚本开启工单提权,北向调用脚本接口无法使用。
  • 操作场景 通知管理主要是提供变更、事件、问题等 消息通知 模板,满足不同阶段和场景的通知诉求。同时支持按需订阅通知,防止信息多,无法获取重要信息。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的方式,进行消息通知,实现了自动通知的功能。 上述几种类型的运维工单,系统均内置了多个场景的通知模板,您可以根据您的场景选择通知模板。 通知管理为用户创建通知规则,通知规则包含事件通知、问题通知、变更通知和告警通知。
  • 概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证 服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续消息通知的需要。 父主题: 人员管理
  • 支持场景 创建应用韧性评估任务,在评估时会自动关联应用下的资源进行分析并给出评估报告。在评估报告中会给出识别到的风险和优化建议。 1. 当前应用韧性评估,允许评估一个应用下最多100个资源实例。若资源数量超出限制,则会评估失败,并给出相应报错。 2. 当前应用韧性评估中,只支持对部分云服务的资源进行评估,若应用中存在不支持的云服务资源,则默认忽略对该云服务的资源进行评估。详情如表1所示。 3. 当前应用韧性评估中,只支持对部分区域内的云服务资源进行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。
  • 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。
  • 镜像与武器版本支持声明 COC混沌演练目前已支持弹性云服务器(E CS )、裸金属服务器(BMS)和Flexus应用服务器 L实例 (FlexusL)三种探针类武器的攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。其中,探针类武器包括体验类、主机资源、主机进程、主机网络模块中的武器。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 以下是ECS、BMS和FlexusL各镜像版本与支持的探针类武器声明: CentOS 6.10镜像及以下版本,因系统缺少探针包运行所必要的共享库(GLIBC_2.14和GLIBCXX_3.4.15)不支持部分探针类武器。 ECS各镜像版本支持的探针类武器如表1所示。 表1 弹性云服务器与武器兼容性列表 武器 支持的镜像版本 备注 体验类 小试牛刀 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - 主机资源 CPU使用率加压 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - 内存使用率加压 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - 磁盘使用率加压 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - 磁盘IO加压 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - 主机进程 进程号耗尽 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 EulerOS镜像进程号耗尽,可能触发保护机制导致内核重启,导致演练失败 杀进程/持续杀进程 CentOS 7.2、CentOS 7.6、CentOS 7.9、CentOS 8.2、Ubuntu16.04、Ubuntu 18.04、Ubuntu 20.04、Ubuntu 22.04、EulerOS 2.2、EulerOS 2.5、EulerOS 2.9、EulerOS 2.10、Debian 8.2.0、Debian 8.8.0、Debian 9.0.0、Debian 11.1.0、Huawei Cloud EulerOS 2.0 - BMS各镜像版本支持的探针类武器如表2所示。 表2 裸金属服务器镜像与武器兼容性列表 武器 支持的镜像版本 体验类 小试牛刀 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 主机资源 CPU使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 内存使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 磁盘使用率加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 磁盘IO加压 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 主机进程 进程号耗尽 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 杀进程/持续杀进程 CentOS 7.4、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 主机网络 网络延迟 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络丢包 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络错包 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络包重复 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络包乱序 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网络中断 CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 网卡down CentOS 7.3、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3 篡改DNS 域名 解析 CentOS 6.9、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3、EulerOS 2.9 端口占用 CentOS 6.9、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3、EulerOS 2.9 整机断网 CentOS 6.9、CentOS 7.9、Ubuntu16、Ubuntu 1804、EulerOS 2.3、EulerOS 2.9 FlexusL各镜像版本支持的探针类武器如表3所示。 表3 Flexus应用服务器L实例镜像与武器兼容性列表 武器 支持的镜像版本 体验类 小试牛刀 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 主机资源 CPU使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 内存使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 磁盘使用率加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 磁盘IO加压 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 主机进程 进程号耗尽 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 杀进程/持续杀进程 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 主机网络 网络延迟 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络丢包 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络错包 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络包重复 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络包乱序 CentOS 7.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网络中断 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 网卡down CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 篡改DNS域名解析 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 端口占用 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0 整机断网 CentOS 7.2、CentOS 8.2、Ubuntu 16.04、Ubuntu 22.04、EulerOS 2.0、Debian 8.2、Debian 11.1.0
  • 注意事项 OS诊断目标实例UniAgent状态需要为运行中,UniAgent相关操作请参考配置UniAgent。 OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB) Y CentOS CentOS7.9 Y CentOS 8.0 Y CentOS 8.2 64bit Y CentOS7.8 Y CentOS7.7 Y CentOS7.6 Y CentOS7.5 Y CentOS7.4 Y CentOS7.3 Y CentOS7.2 Y CentOS6.10 N Ubuntu Ubuntu 20.04 server 64bit Y Ubuntu 22.04 server 64bit Y Ubuntu 18.04 server 64bit Y Ubuntu 16.04 server 64bit Y EulerOS EulerOS 2.5 64bit Y Debian Debian 9.0.0 64bit Y Debian 8.8.0 64bit Y Debian 8.2.0 64bit Y Debian 12.0.0 64bit N Debian 11.1.0 64bit Y Debian 10.0.0 64bit Y OpenSUSE OpenSUSE 15.0 64bit Y AlmaLinux AlmaLinux 9.0 64bit N AlmaLinux 8.4 64bit N AlmaLinux 8.3 64bit N Rocky Linux Rocky Linux 9.0 64bit N Rocky Linux 8.5 64bit N Rocky Linux 8.4 64bit N CentOS Stream CentOS Stream 9 64bit Y CentOS Stream 8 64bit Y CoreOS CoreOS 2079.4.0 64bit N openEuler openEuler 22.03 64bit Y openEuler 20.03 64bit Y Others FreeBSD 11.0-RELEASE 64bit N ARM Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB) Y Ubuntu Ubuntu 18.04 server 64bit Y CentOS CentOS 7.6 64bit with ARM N EulerOS EulerOS 2.8 64bit with ARM N Debian Debian 10.2.0 64bit with ARM N KylinOS Kylin Linux Advanced Server for Kunpeng V10 N openEuler openEuler 20.03 64bit with ARM N
  • 问题管理流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程
  • 自动化执行参数示例说明 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,相关示例如下: 参考示例: 告警信息如下: { "alarmId": "al1696664837170EWbvx24kW", "alarmName": "alarm-4z39coctest1007", ...... "URL": "https://console.ulanqab.huawei.com/ces/?region=cn-north-7#/alarms/detail?alarmId=al16849986549022X5Vp4pxr", "additional": { "dimension": "instance_id:29d99a09-2d15-4ced-8723-6e94ae1c1472", ...... }, ...... } 1. 如果要获取当前告警信息里面的alarmId的值,表达式写成如下形式: ${currentAlarm.alarmId} 2. 如果要从additional.dimension字符串里面获取instance_id的uuid,表达式写成如下形式: ${string.substring(currentAlarm.additional.dimension, string.indexOf(currentAlarm.additional.dimension, 'instance_id:') + 12)} 或者 ${string.substring(currentAlarm.additional.dimension, 12)} 3. 如果要从URL字符串里面获取cn-north-7这个region ID,表达式写成如下形式: ${string.substring(currentAlarm.URL, string.indexOf(currentAlarm.URL, 'region=') + 7, string.indexOf(currentAlarm.URL, '#/alarms'))} 表达式里面的"currentAlarm."是个固定前缀,意思是从当前告警的数据里面获取。
  • 概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如 CES AOM 、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。 注意,初始生成的汇聚告警为当前告警,用户对汇聚告警进行处理、转事件或清除操作后,其会被转移到历史告警中。 此外,本功能可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。 图1 告警管理流程 父主题: 告警管理
  • 概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理”状态,未受理状态下可进行“转发”、“驳回”、“受理”等操作。 事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件单暂停功能,可参考基础配置-事件流程。 图1 事件管理流程 父主题: 事件管理
  • 概述 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码,在安全管控下支持无需输入密码可登录linux主机执行命令。账号密码管理、自动改密和免密登录操作如下。 账号密码管理场景步骤: 导入账号、查看账号密码。 自动改密及免密登录场景步骤: 当前已有资源可自动改密:账号管理-账号基线中配置账号基线。 后续新增资源的自动改密:账号管理-改密策略中配置改密策略。 按照region维度定期改密:账号管理-改密任务添加region。 配置后可查看账号密码、免密登录。 自动改密当前支持的区域如下: 华北-北京一 华东-上海二 华东-上海一 华南-广州 亚太-新加坡 亚太-曼谷 非洲-约翰内斯堡 华北-乌兰察布一 西南-贵阳一 华北-北京二 华北-乌兰察布-汽车一 华北-北京四 中国-香港 华北-乌兰察布二零一 拉美-圣地亚哥 父主题: 账号管理