检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
治理:提供OS合规性自动化定时巡检能力,打造开箱即用体验,同时保留客户自定义能力,及时发现OS合规性问题并输出合规性报告; 运维:基于合规性报告触发补丁修复,通过增量迭代方式保证OS合规性全覆盖,保证OS合规性问题闭环SLA; 图1 一站式资源运维 补丁管理:COC提供OS补丁管理能力,支持对Linux下的Huawei
收藏企业项目 操作场景 资源管理提供了用户收藏企业项目的能力,可以通过企业项目筛选相关资源。当资源较多时,您可以选择已收藏的企业项目快速筛选出资源。 收藏企业项目 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。 点击右上方“收藏配置”。 设置“收藏配置”。
完成各项配置任务,配置完成后,即可在云运维中心对应场景中进行相关运维操作。 云服务配置:提供云监控服务(CES)的多区域告警规则一次性配置能力。 云运维中心配置 登录云运维中心。 进入COC“总览”后,可以看到快速配置中心。 图1 快速配置中心 如果“总览”页面,没有显示快速配置
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
FullAccess 查看待办任务 √ √ 创建及处理待办任务 x √ 查看资源列表 √ √ 资源纳管 x √ 查看脚本列表 √ √ 增删改及执行脚本 x √ 查看作业列表 √ √ 增删改及执行作业 x √ 执行ECS操作 x √ 查看定时运维任务 √ √ 增删改及执行定时运维任务 x √ 查看参数中心
SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义SLA,或使用COC预置的公共SLA规则。
计费说明 COC于2024年7月31日在中国站、国际站转商,转商后COC本身的基础功能免费,若后续部分高阶产品能力开始收费,提前30天通知。 云运维中心与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。
快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。 确保已接入CES监控,请到集成管理进行配置。 已创建事件单。 如
式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。 资
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。 本章节介绍如何通过云运维中心操作一台ECS执行重启作业。
1、当前账号已经开启跨账号管理,并且是组织/委托管理员账号。 2、组织成员账号已开通云运维中心COC服务。 操作场景 云运维中心提供运维态势感知的能力,包含变更、事件、告警、安全合规、SLO(服务级别目标)、PRR(生产准备度评估)等多种运维指标数据,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
创建委托指导 背景 若您的企业组织存在多个租户账号,您可以使用COC的跨账号能力在创建CES告警规则、执行作业等场景通过一个账号完成多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。 父主题: 故障管理常见问题
在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力 图1 事件审批 单击“新建事件审批”配置事件降级或事件暂停的流程,选择事件流程、事件级别和审批配置。 图2 新建事件审批流程 配置完成后
行处理、转事件或清除操作后,其会被转移到历史告警中。 此外,本功能可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。 图1 告警管理流程 父主题: 告警管理
免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进
资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。 资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使用文件传输能力,需要在对象存储服务中购买存储桶。 执行公共脚本 华为云Flexus云服务 资源运维中,可以对Flexus应用服务器L实例进行批量操作、脚