检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件
故障模式 操作场景 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件
批量开机 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L开机功能,您可以对Flexus L实例执行单独或批量开机的操作。 注意事项 所选实例处于关机状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开机
批量重启 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L重启功能,您可以对Flexus L实例执行单独或批量重启的操作。 注意事项 所选实例处于运行中或重启状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。
批量关机 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L关机功能,您可以对Flexus L实例执行单独或批量关机的操作。 注意事项 所选实例处于运行中状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量关机
批量停止 操作场景 云运维中心提供了统一操作RDS实例的功能。通过批量RDS停止实例功能,您可以对RDS实例执行单独或批量停止实例的操作。 注意事项 所选实例处于正常状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量停止 登录云运维中心。 在左侧导航栏选择
快速配置中心 操作场景 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理
批量重启 操作场景 云运维中心提供了统一操作RDS实例的功能。通过批量RDS重启实例功能,您可以对RDS实例执行单独或批量重启实例的操作。 注意事项 所选实例处于正常状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择
批量开启 操作场景 云运维中心提供了统一操作RDS实例的功能。通过批量RDS开启实例功能,您可以对RDS实例执行单独或批量开启实例的操作。 注意事项 所选实例处于已停止状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开启 登录云运维中心。
批量重启 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重启功能,您可以对ECS实例执行单独或批量重启的操作。 注意事项 所选实例处于运行中或重启状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择
批量重启 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重启功能,您可以对BMS实例执行单独或批量重启的操作。 注意事项 所选实例处于运行中或重启状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10
概述 应用韧性评估用于衡量应用在面对各种干扰和压力(如硬件故障、网络波动、流量峰值、安全攻击等)时,能够维持正常功能和性能的评估方式。韧性的概念不仅仅局限于恢复能力,还包括预防问题、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估项
查看历史告警 操作场景 历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
一站式资源运维 实践场景 某电商运维人员在日常工作中发现,云上资源合规性问题突出,OS合规性风险尤为明显,引发客户对云上OS安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3