检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户编辑时,若填写
本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业,并自动通知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。 注意,初始生成的汇聚告警为当前告警,用户对汇聚告
选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。 默认选择“弹性云服务器ECS”。 选择需要查看的主机资源,单击操作列“更多 > 改密记录”。 查看该主机资源改密记录信息。
),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。
变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 变更管控:是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
操作场景 事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
单击“账号改密 > 改密任务”。 设置“定期改密区域”。 单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。 配置好后可单击操作列“查看任务详情”,查看配置区域的改密任务。 不需要的区域可单击操作列“删除”。 父主题: 账号管理
事件审批 操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力
作进行。 注意事项 在编辑脚本时确认脚本内容的风险等级,并如实填写风险等级。 编辑自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要编辑的脚本,单击操作列“编辑”。 参数信息与创建自定义脚本基本相同,请参考创建自定义脚本。
用户添加策略:进入“IAM”服务,选择“用户”,点击“添加权限”,选择“直接附加策略”,将上一步中创建的策略选上,点击“下一步”完成添加权限。 选择需要同步资源所属账号。 默认选择“我的资源”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 单击筛选框右侧。 父主题: 资源管理
查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊
设置“创建应用”。 每个层级的必填字段填写完成需要点击“保存”进入下个层级,所有层级的必填字段填写完毕后,才可以点击“创建”按钮创建应用。 表1 创建应用参数说明 参数 说明 示例 应用结构类型 请根据应用结构的复杂类型选择。 轻量级应用 应用名称 根据命名规则,自定义应用的名称。 测试应用
需要先在应用管理中创建您的应用。 创建问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 单击右上方“创建问题单”。 设置“创建问题单”。 表1 创建问题单参数说明 参数 说明 问题标题 自定义问题的标题。 问题描述 对问题进行描述,具体描述问题现象和对现网的影响。 上传附件
进行。 注意事项 在编辑、克隆作业时确定作业的风险等级,并如实填写风险等级。 编辑自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。
警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。 汇聚告警产生后,条件满足SLA记录设置的级别和应用,生成对应的SLA记录。
以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“升降级”。 设置“升降级”。
开启后在后续创建作业中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。 风险等级 作业的风险等级,可选项“高”、“中”、“低”。 在后续创建自定义作业中,若选择了审批配置中勾选的风险等级,将会强制填写审批配置中配置的企业项目、审核人和通知渠道。 企业项目 在下拉列表中选择企业项目。
默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 选择需要修改的规则,单击操作列“修改”。