检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
构筑全场景资源管理驾驶舱,覆盖华为公有云、客户IDC等场景。 提供多视角数据呈现能力,挖掘数据价值,辅助整体运维决策。 云上运维能力延伸至客户IDC,淡化云边界,提升运维效率。
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的创建配置、删除、编辑修改、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。
安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
] } ] } 1. 委托需要支持的操作就代表了委托的授权。 2. 当前创建CES告警规则中包含了告警通知功能,通知功能受限于周边服务对外开放能力,故当前仅开放了主题订阅一种通知方式; 3. 在配置CES告警规则参数时,通知主题是依托于登录的管理员租户(组织管理员或组织
变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑运维知识库,实现已知故障快速恢复,未知故障沉淀经验。
概述 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能:
产品功能 云运维中心COC提供的常用功能特性参见表1 云运维中心COC功能概览。 表1 云运维中心COC功能概览 功能名称 功能描述 发布区域 总览 COC全局总览页面,包含资源总览、资源监控、应用监控、安全概览、快捷入口等多个板块。用户可以在总览页面便捷查看、处理工作项,降低运维复杂度,改善运维体验。
告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。
设置列表展示字段。 单击“添加中断记录”,右边弹出添加中断记录弹框,选择对应的数值,添加中断记录。 图2 添加中断记录 单击右侧“修正”,右边弹出添加中断记录弹框,修改中断的不可用时间。 图3 修正中断记录 单击右侧“修正记录”,右边弹出添加中断记录弹框,查看修正的历史记录。 图4
与其他云服务的关联 云运维中心COC服务与其他服务的关系,如图1所示。 图1 与其他服务的关系 表1 与其他服务的关系 服务名称 与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。
如果您是在跨账号场景下使用运维态势感知,需要满足以下前提条件: 1、当前账号已经开启跨账号管理,并且是组织/委托管理员账号。 2、组织成员账号已开通云运维中心COC服务。 操作场景 云运维中心提供运维态势感知的能力,包含变更、事件、告警、安全合规、SLO(服务级别目标)、PRR(生产准备度评估)等多种运维
云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 在云服务选择组件处可切换需要查看的云服务类型。 图2
若需要添加已有任务,单击“选择已有”,勾选已有任务,单击“确定”。 若需要添加新的攻击任务,请参考后续步骤。 表2 添加新的攻击任务参数说明 参数 说明 示例 云厂商 请选择云厂商类型。 华为云 攻击目标来源 请选择目标实例的来源。 云容器引擎 (CCE)支持通过选择实例、指定pod、指定数量方式选择攻击目标。 弹性云服务器(ECS)
启动WarRoom 操作场景 事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。
数值和解密数据,请按如下操作进行。 查看参数详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“参数中心”。 选择需要查看的参数,单击参数名称。 若参数类型为加密文本:单击参数值旁边查看敏感参数值,单击“查看解密数据”查看所有版本的参数值。
远程安装UniAgent。 代理区域 当接入方式选择代理接入时,需选择代理区域。 代理区域是对代理机的分类管理;代理机是指在华为云购买和配置一台华为云弹性云服务器ECS,为解决多云之间网络互通。 安装机 在下拉列表选择安装机。 选择一台已经安装了UniAgent的主机作为安装机,