检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置UniAgent 操作场景 UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座, 提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维
开始评估 操作场景 当您需要对应用韧性评估任务进行评估时,请按如下操作进行。 若评估状态为“未评估”,详细操作请参考开始评估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告
通知管理 操作场景 通知管理主要是提供变更、事件、问题等消息通知模板,满足不同阶段和场景的通知诉求。同时支持按需订阅通知,防止信息多,无法获取重要信息。 当产生事件单、问题单、告警单或有变更单时,通知规则会根据事件/问题/告警/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员
补丁工单 操作场景 在“资源运维 > 自动化运维 > 补丁管理”中执行补丁扫描或补丁修复任务后,若您需要跟踪和记录补丁扫描/修复的执行对象及执行结果,可以在“任务管理 > 执行记录 > 补丁工单”页面查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择
自定义SLA 操作场景 用户可根据实际业务需要,制定所需工单类型的SLA目标规则、预警规则,以便规范工单责任人在日常工作中及时响应处理工单。 查询自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面。 在“SLA”页面选择“自定义SLA”页签,即可查看自定义
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程
批量重装操作系统 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重装操作系统功能,您可以对BMS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单
概述 排班管理为云运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件中心
清除告警 操作场景 当汇聚告警生成后,会显示在当前告警页签。若告警已经处理完毕或由于其他原因需要清除,可以通过清除告警功能将汇聚告警从当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,
变更配置 操作场景 若需创建变更单,需在变更配置中根据自身业务诉求,从变更类型、变更级别两个维度配置审批流程&审批人。 创建审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,单击“创建审批配置”,进入“创建审批配置”页面。 图1 创建审批配置 填写审批配置内容
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,
批量切换操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L切换操作系统功能,您可以对Flexus L实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行
批量重装操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS重装操作系统功能,您可以对ECS实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在未关机的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单
批量切换操作系统 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS切换操作系统功能,您可以对ECS实例执行单独或批量切换操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行。 无其他正在执行的工单,比如所选实例已有重启工单
批量重装操作系统 操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L重装操作系统功能,您可以对Flexus L实例执行单独或批量重装操作系统的操作。 注意事项 如果存在运行中的实例,需要勾选“立即关机”。 如果不存在运行中的实例,则可直接提交执行
什么是云运维中心 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告,在故障报告基础上对本次故障进行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和启动了
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理