检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
64bit 对于Linux x86_64服务器,支持上表中所有的操作系统及版本。 对于Linux ARM服务器,当前CentOS操作系统支持7.4/7.5/7.6版本,EulerOS操作系统支持2.0版本,Ubuntu操作系统支持18.04版本 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动Warroom,缩短故障处理非必要耗时,指挥中心实时观测故障处理进展。故障回溯
告警管理 统计参与处理告警的人数 去重计算集成告警的责任人数量 天/月 人 人均告警处理量 告警管理 统计人均处理的告警数量 选择时间范围内,告警总数量/告警参与人数 天/月 人 告警自动化处理率 告警管理 统计告警的自动化处理情况 选择时间范围内,自动化处理告警/告警总数*100%
可选配置演练监控任务指标,演练监控指标,分为“稳定指标”和“监控指标”。“稳态指标”是在演练过程中用于衡量应用是否正常运行的关键指标,若在演练之前或演练过程中,“稳态指标”不在对应的上下限区间内,演练将自动停止。“监控指标”是在演练过程中对一些业务指标进行监控,您根据这些监控数据判断演练风险和应用是否正常运行。
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3 故障处理 若选择脚本为处理方式,关联脚本可以选择“自定义脚本”和“公共脚本”。 图4 关联自定义脚本 图5 关联公共脚本 若选择作业为处理方式,关联
列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。 启用/禁用公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面,选择“公共SLA”页签,进入公共SLA界面。
事件历史记录 操作场景 可以查看事件的历史记录,包含事件的整个处理过程。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件页面详情 单击“ 事件历史”查看事件历史记录。 图2 查看事件历史记录
补丁/脚本/作业/ECS操作 执行工单时,超时时间小于等于86400秒(即24小时)。 资源管理 安装UniAgent支持操作系统 目前支持的Linux操作系统版本有: EulerOS 2.2 64bit for Tenant 20210227 EulerOS 2.3 64bit EulerOS
操作场景 问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询历史记录。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入全部问题列表页面。 点击问题单名称进入问题详情页面,单击“历史记录”页签查看问题处理历史记录。 图1 问题处理记录 父主题: 问题管理
事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录 父主题: 故障管理
U使用率加压的故障演练。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。 步骤一:同步资源 获取当前用户所属的所有Region下资源数据并同步至云运维中心。 步骤二:创建应用 管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。
发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 问题流程 创建问题 处理问题 问题历史记录 父主题: 故障管理
图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑运维知识
到期通知 到期通知时间必须小于到期删除时间 图1 到期通知时间大于到期删除时间 到期通知时间必须大于参数创建或修改的时间 图2 到期通知时间小于系统时间 父主题: 通知规则
本章节为您介绍对用户授权的方法,操作流程如图1所示。 前提条件 给用户组授权之前,请您了解用户组可以添加的COC权限,并结合实际需求进行选择,COC支持的系统权限,请参见COC权限。若您需要对除COC之外的其它服务授权,IAM支持服务的所有权限请参见系统权限。 示例流程 图1 给用户授权COC权限流程 创建用户组并授权
脚本工单 提供用户查看、操作脚本工单的能力。 前提条件 用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过Cloud Operations Center查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1
提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num