检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集成告警中对告警进行处理或转事件处理; 事件中心处理转事件的告警,可进行转发、升降级、启动WarRoom处理。 前提条件 已在应用管理中创建应用分组; 已在人员管理中添加人员信息; 已在排班管理中创建排班。 步骤一:集成管理接入原始告警数据 登录COC。 在左侧导航栏选择“故障管理
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
Array of strings 区域id 最小长度:1 最大长度:255 数组长度:0 - 1000 application_id_list 是 Array of strings 影响应用id 最小长度:1 最大长度:255 数组长度:1 - 1000 incident_number 是
图2 制定PRR模板 表1 制定PRR模板参数说明 参数名称 说明 模板名称 PRR模板的名称 模板描述 PRR模板的详细描述 应用分类 PRR模板所属的应用分类 PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的
入“起会规则”列表。 图1 起会规则列表 在“起会规则”列表,选择需要修改的起会规则,单击“编辑” 修改起会规则。输入规则名称,选择区域,应用,事件级别,加入群组信息,完成后,单击“确定”修改起会规则。 图2 修改起会规则 修改完成,可以在起会规则列表查询修改后的规则。 父主题:
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
选择“业务是否中断”,如果选择“否”,继续执行步骤五;如果选择“是”,必须填写“故障发生时间”及“故障恢复时间”。此处填写的业务中断时间计入对应应用的SLO中断记录。 图1 清除告警-业务中断 生成SLO中断记录需要先设置对应的SLA规则、SLO规则,并且该告警存在对应的SLA记录。 输入备注,单击“确定”,清除告警。
支持:刷新列表数据、设置列表展示字段。 图2 筛选SLO 单击列表中的,查看详情。 图3 SLO详情 单击右上角“创建SLO”,选择对应的应用与SLO目标值创建SLO。 图4 创建SLO 在SLO管理列表中,选择对应“操作”列中“更多 > 编辑”,编辑SLO指标。 在SLO管理列表中,选择对应“操作”列中“更多
首次安装UniAgent如何操作? 登录COC。 在左侧菜单栏单击“应用资源管理”,进入“资源管理”页面,选中首台未安装过UniAgent的机器。 图1 安装UniAgent 在跳转的安装UniAgent页面中,单击 “手动安装”。 图2 安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。
未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件 父主题: 帐号管理
纳管主机帐号。用户也可通过“创建帐号基线”方式(推荐)来自定义需要纳管的主机帐号,前提是主机已绑定组件(未绑定的主机可先在CMDB侧先创建应用再创建组件)。 图1 创建组件基线 输入“基线名称”后,根据自身业务需求,依次添加基线帐号,例如帐号名称:root,帐号分级:非只读帐号。
深度诊断 coc:application:GetDiagnosisTaskDetails 查询应用资源诊断任务的权限。 aom:uniagentAgent:install; aom:uniagentAgent:uninstall; √ x x x coc:application:CreateDiagnosisTask
在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。
服务的命名空间 namespace namespace region Region template_variable中的Region / application 应用名 / / resourceName 资源名称 template_variable中ResourceName metadata中的resource_id
最小长度:1 最大长度:255 regionId 否 String 告警发生区域 最小长度:0 最大长度:255 applicationId 是 String 应用id 最小长度:1 最大长度:255 resourceName 否 String 资源名称 最小长度:0 最大长度:255
WarRoomEnumeration object warroom 状态 impacted_application Array of impacted_application objects 影响应用 数组长度:0 - 1000 processing_duration Long 处理时长(分钟)
如果您已开通云运维中心,请忽略此步骤。 步骤一:同步资源 登录云运维中心。 单击总览页面左上角的,选择区域。 在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。 单击按钮同步资源。 图1 同步资源 步骤二:安装UniAgent 在“资源管理”页面,勾选目标弹性云服
最小长度:0 最大长度:255 数组长度:0 - 1 current_cloud_service 是 Array of strings 归属应用ID,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 incident_level 是 String 事件级别 参考:枚举