检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
别和描述不符合,支持用户自定义事件级别和描述。修改后会在创建事件单页面显示最新定义的级别。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件级别。 图1 事件级别 单击操作列“编辑”修改事件级别和描述。,若某个级别不需要开启可将列表中是否开启的开关关闭。
用户可根据实际业务需要,制定所需工单类型的SLA目标规则、预警规则,以便规范工单责任人在日常工作中及时响应处理工单。 查询自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面。 在“SLA”页面选择“自定义SLA”页签,即可查看自定义SLA列表。 图1 SLA列表 单击搜索框,弹出搜索条件
事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。 修改规则 仅管理账号可修改复盘规则。
问题类型 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>问题类型,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 问题类型 若不使用系统预置的问题类型,可将是否开启列表中开关关闭。若需要新增问题类型,单击“新增问题类型”,添加问题类
置通知方式等,具体操作如下。 添加用户 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员 编辑用户信息 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,选择需要编辑的人员在对应行“操作”列单击“编辑”。 图2
处理或转事件,定位恢复后,清除告警。对于无法清除的告警,可以转事件进行升级或启动WarRoom处理。形成规范性告警处理流程,避免告警处理异常。 标准化事件处理流程包含以下步骤: 集成管理接入原始告警数据; 配置流转规则,对告警进行清洗处理; 在通知管理中,根据通知场景配置通知模板,选择通知对象以及通知方式;
在下拉列表选择事件涉及故障的应用。 业务是否中断 可选项“是”、“否”。 责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 个人:选择责任用户。配置责任用户详细操作请参考人员管理。 单击“确定”。 完成事件单创建。 父主题: 事件管理
此外,本功能可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。 图1 告警管理流程 父主题: 告警管理
质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 问题管理流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。
创建流转规则 操作场景 用户通过流转规则可以实现事件、告警等规则的自定义配置。通过配置流转规则,将原始告警转成汇聚告警或事件。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 创建规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。
多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。 在COC服务快速配置中心-云服务配置板块使用跨账号配置功能,如下图示例。 图1 快速配置中心-云服务配置跨账号功能图示 委托功能说明
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
操作场景 根据业务需要,您可以通过运维中心配置需要开启定期改密的区域,改密周期初始默认 0 15 3 ? * * ,表示每天上午3:15执行任务。配置之后,我们将会为每一个区域创建一个定时改密的任务,您可前往管理定时任务查看并修改此任务。 配置改密区域 登录云运维中心。 在左侧导航栏选择“资源管理
创建群组方式 可选项“企业微信”、“钉钉”、“飞书”。 请先在移动应用管理配置应用通知方式,选择后WarRoom拉起会将排班人员和参与者拉入对应的群组中。 排班 按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 参与者 在下拉列表选择参与用户。可以选择多个用户。
资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域 > 分组 > 资源模型”进行管理,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 补丁管理
变更管控 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。 前提条件 开启变更管控需要申请IAM权限,具体的actionID如下: IAM v3版本权限: "iam:roles:listRoles", "iam:p
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
执行页面,账号来源于账号基线中配置的账号且OS主机存在的账号。 注意事项 主机可以成功远程登录的前提条件。 安装UniAgent且UniAgent的状态为运行中并UniAgent的版本需要大于1.1.3.8。 主机状态为运行中。 主机中存在基线中配置的账号且账号可登录。 免密登录
资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户开通云审计服务并创建和配置追踪器后,CTS可记录与云运维中心服务相关的操作事件。 详细的