检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
机器无法选择? 请确认机器状态是否正确,资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。 父主题: 补丁管理常见问题
纳管主机。 图2 基线信息录入 主机的某个帐号能被成功纳管有三个前提条件: 1、安装UniAgent且UniAgent的状态为运行中。 2、主机状态为运行中。 3、主机中存在基线中配置的帐号且帐号可登录。 为了确保组件下新增的主机实例能被自动纳管,还需在“帐号改密”->“改密策略”页面的组件维度下进行关联操作。
件为: 您的资源实例信息已经同步到COC中,具体操作指导请见:同步资源; 您的资源实例已经安装UniAgent且UniAgent运行正常、状态为“运行中”; 在实例上安装UniAgent,需要您提供实例的管理员账号密码,若您的资源实例未安装UniAgent且您已忘记密码,则无法安
态。若“改密状态”为“失败”,需要先根据反馈的改密失败原因进行相关处理。 ECS主机改密条件: 1、主机资源状态为“运行中” 2、主机的UniAgent状态为“运行中” 3、主机OS上的帐号与所绑定的帐号基线中的帐号一致 增量的ECS主机改密条件: 1、改密策略已开启 已纳管的主机定期改密条件:
”配置自动化任务。 图1 点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
artServer接口后,再通过等待API结果原子动作调用ECS的ShowServer接口,直到接口响应中的状态变为ACTIVE,即状态为运行中,才判定ECS实例已经启动成功。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发
钉钉:用户钉钉群聊机器人的webhook地址 飞书:用户飞书群聊自定义机器人的webhook地址 人员信息中的通讯方式用途简介: 在编辑通讯方式保存后,系统后台会创建对应的消息通知方式订阅,用于其他场景下向用户发送消息通知使用。 手机号码:填写保存后,系统会为该用户在SMN服务创建通知方式为“短信
1、用户仅能启用/禁用自己创建的定时任务。可查看当前租户账号下其他用户创建的定时任务。 2、任务启用后,开始生效,在后台创建定时调度,到达执行时间时开始执行。禁用后,在后台删除定时调度,不再执行。 编辑定时任务 登录COC。 在左侧菜单栏选择“资源运维>自动化运维”,在“日常运维”模
概述 流转规则将所有接收的集成原始告警进行去重操作,支持每个流转规则配置事件时默认分配对象&通知策略,从而实现更准确的通知。 父主题: 流转规则
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景
人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户在编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续消息通知的需要。 在人员管理页面可通过用户信息字段颜色区分当前是否存在订阅,灰色:用户未订阅或订阅
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
当产生事件单、问题单或有变更单时,通知规则会根据事件/问题/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通知模板为系统内置的,您可以根据您的场景选择通知模板。 创建通知 创建通知规则,事件单、问题单和变更单触发对应场景后会自动发送通知。
全链路故障诊断 操作场景 当事件创建后,您可以通过全链路故障诊断,快速定位故障根因。我们面向客户应用提供应用层、组件层、资源层的关系拓扑,实现基于资源和应用告警的异常染色,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
本文介绍如何配置流转规则。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 操作场景 管理流转规则,通过流转规则实现事件、告警等规则的自定义配置。 新增流转规则操作步骤 登录COC。 在左侧导航栏选择“故障管理 > 流转规则”,进入“流转规则”页面。 在
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。
ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。 安全生产、运维大脑、故障管理等优秀实践使能客户极简运维。 一朵云使用体验 构
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则