检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通知管理 通知管理为用户创建通知规则,通知规则包含事件通知、变更通知和问题通知。 当产生事件单、问题单或有变更单时,通知规则会根据事件/问题/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通
单击列表数据中的“待办名称”,进入“待办详情”页面。 图6 待办详情 在“待办详情”页面,单击附件名,即可下载附件。 图7 下载附件 附件下载限流,限流策略:两次触发下载之间必须间隔5秒。 受理待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,选择“待处理的”页签。 单击列表
清除告警 登录COC。 在左侧菜单栏选择“故障管理 > 告警管理”,选择“汇聚告警 > 当前告警”页签,查看集成告警列表信息。 在集成告警列表中勾选告警单,单击“清除”或“批量清除”。 选择“业务是否中断”,如果选择“否”,继续执行步骤五;如果选择“是”,必须填写“故障发生时间”
SLA记录 查看SLA记录 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面,选择“SLA记录”页签,跳转到SLA记录列表界面。 图1 查询SLA记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
参数仓库已选参数和已选主机实例不能跨Region? 安全生产规则,参数仓库已选参数和已选主机实例不允许跨Region操作,选择实例和参数仓库选择的区域需要一致。 图1 参数仓库 图2 选择实例 父主题: 参数管理常见问题
自定义脚本参数输入值无效? 自定义脚本参数值需要满足如下规则: 参数值长度为1-1024位。 可以包含大写字母、小写字母、数字以及特殊字符(_-/.*?:",=+@\[{]})和空格。 禁止出现连续‘.’。 父主题: 自动化运维常见问题
处理事件 操作场景 受理事件后处理事件单。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 若流转规则创建的事件单关联了响应预案,在处理事件单过程中可执行响应预案。单击页面中“执行响应预案”跳转至“执行响应预案”页面。
补丁基线 补丁基线提供了用户可以自定义扫描以及安装的规则的能力,通过自定义补丁基线,补丁扫描安装时会通过用户所设置的补丁基线进行补丁的过滤筛选,扫描或者修复符合基线的补丁。 补丁基线拥有ECS、CCE以及BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 Cloud
排班场景管理 本文介绍如何管理排班场景及排班角色 创建排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图1 场景管理 单击“创建排班场景”,创建排班场景。 图2 排班场景列表 填写排班场景的基本信息,单击“确定”。
启动WarRoom 操作场景 重大事件需启动WarRoom攻关,进行拉会处理事件,事件可快速恢复。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件单详情 单击“启动WarRoom”。 图2
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
约束与限制 云运维中心COC为全局服务,但在部分特殊区域(专属区域、HCSO等)暂不支持,如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
WarRoom 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理
快捷混沌演练 操作场景 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式
自定义SLA 租户可自由定制自己需要的SLA。 查询自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面。 在“SLA”页面选择“自定义SLA”页签,即可查看自定义SLA列表。 图1 SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
参数管理 参数中心 通知规则 父主题: 自动化运维