检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
事件创建后,事件责任人分析事件实际情况,若属实则事件责任人受理事件并进行后续处理,完成事件的闭环。 受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理,事件状态变更为“已受理”。
驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
您可以在定时运维页面查看定时任务的执行历史记录,历史记录呈现脚本工单/作业工单,支持跳转查看每一个工单详情。 查看定时任务执行记录 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。 选择需要查看的任务,单击操作列“更多 > 历史记录”。
驳回问题 操作场景 若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1.1.0以下重试。 父主题: 补丁管理常见问题
操作场景 事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
作进行。 注意事项 在编辑脚本时确认脚本内容的风险等级,并如实填写风险等级。 编辑自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要编辑的脚本,单击操作列“编辑”。 参数信息与创建自定义脚本基本相同,请参考创建自定义脚本。
进行。 注意事项 在编辑、克隆作业时确定作业的风险等级,并如实填写风险等级。 编辑自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。
在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。 表1 改进处理参数说明 参数 说明 问题原因 请填写问题发生的原因。 限制长度1-1000个字符。 改进措施 请填写详细的改进措施。 限制长度1-1000个字符。
应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。 脚本管理 脚本内容 自定义脚本内容≤4096字节。 作业管理 全局参数 单个自定义作业的全局参数≤30个。 Warroom 起会规则 租户创建的Warroom起会规则个数≤50个。
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。 表1 定位出方案参数说明 参数 说明 问题应用 默认创建问题选择的应用。在下拉列表选择涉及问题的应用。 是否为共性问题 可选项“是”、“否”。 发现问题版本号 可选参数。请输入问题对应的版本号。
接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
补丁修复后合规性报告仍然为不合规如何处理? 单击修复后生成的合规性报告摘要 图1 合规性报告摘要 查看不合规的补丁状态,根据状态不同查看不同解决方案 表1 不同合规性状态的解决方案 不合规状态 解决方案 失败 查看生成此合规性报告的补丁工单日志,根据失败的日志解决此问题 已安装待重启 补丁已安装修
类问题。 事件类别 可选参数。在下拉列表选择事件的类别。 区域 可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及的故障应用。 业务是否中断 可选项“是”、“否”。
登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要禁用的规则,单击操作列“禁用”。 单击“确定”。 完成流转规则禁用。 启用规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要启用的规则,单击操作列“启用”。 单击“确定”。 完成流转规则启用。 修改规则
首次安装UniAgent如何操作? 登录COC。 在左侧菜单栏单击“应用资源管理”,进入“资源管理”页面,选中首台未安装过UniAgent的机器。 图1 安装UniAgent 在跳转的安装UniAgent页面中,单击 “手动安装”。 图2 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
开通云运维中心并授权使用 开通云运维中心 角色授权的示例 策略授权的示例 跨账号管理