检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。 图2 区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。 图4 查询资源信息
在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。 图2 创建问题页面 问题标题:必填,简要填写问题描述 问题描述:必填,具体描述问题现网和对现网的影响,支持上传附件 问题来源:
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
最小长度:1 最大长度:256 type String 脚本类型 SHELL:shell脚本, PYTHON:Python脚本, BAT:Bat脚本, 枚举值: SHELL PYTHON BAT content String 脚本内容 最小长度:1 最大长度:4096 script_params
标签的值允许包含任意语种字母、数字、空格和_ . : / = + - @特殊字符,但首尾不能含有空格,限制长度最长256个字符。 已有标签支持修改,点击标签的键或值,输入标签新的的键或值。 单击“确定”,完成标签编辑。 删除标签 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。
COC应用韧性评估基于华为最佳实践经验,定义了300+的评估项,覆盖节点、集群、网络、容灾、容器、业务和数据等六种维度,针对以应用为粒度的资源进行韧性评估,帮助客户提前识别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支
除以上的参数,其他参数均放在该参数中,使用additional.xxx表示,CES相关字段描述点击这里查看 除以上的参数,其他参数均放在该参数中,使用additional.xxx表示,AOM相关字段描述点击这里查看 在响应预案部分,选择针对本次流转规则相关联的脚本、作业和应急预案,脚本和作业的添加请参考自动化运维。
标签的值可以包含任意语种字母、数字、空格和_ . : / = + - @特殊字符,但首尾不能含有空格,限制长度最长255个字符。 已有标签支持修改,点击标签的键或值,重新输入标签的键或值。 单击“确定”,完成标签编辑。 删除标签 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。
tity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。如果华为账号已经能满足您的要求,不需要通过IAM对用户进行权限管理,您可以跳过本章节,不影响您使用COC服务的其它功能。
最小长度:1 最大长度:256 type 是 String 脚本类型: 对于脚本后缀: SHELL:.sh PYTHON:.py BAT:.bat 枚举值: SHELL PYTHON BAT content 是 String 脚本内容 最小长度:1 最大长度:4096 script_params
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
云运维中心权限如何配置? 问题描述 如何快速配置云运维中心权限。 解决方法 管理员登录IAM控制台。 管理员在用户列表中,单击新建的用户,右侧的“授权”。 图1 IAM用户授权 授权模型选择“角色授权”。 图2 选择授权模型 授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC
”功能重置主机的密码。 导入账号:账号管理支持主机账号密码的在线托管,您可以通过Excel导入的形式将主机账号的初始密码导入,导入之后您可点击“查看账号密码”来在线查看账号密码。 同步账号:若用户在OS上新增了主机账号,在账号管理页面勾选对应主机后,可通过“同步账号”按钮一键同步
单选 包含事件通知、变更通知。问题通知 通知模板 是 可多选 通知的内容模板,由系统内置,不同通知类型关联出的模板列表不同,选择某一个模板后,鼠标悬浮会展示出通知模板的详情; 通知范围 是 可多选 选择某一个服务,举例:当选择A服务时,事件单中出现的也是A服务时,不考虑其他匹配规则的
通知的第一层分类,按照应用类型进行分类。 通知模板 是 可多选 通知的内容模板,由系统内置,不同通知类型关联出的模板列表不同,选择某一个模板后,鼠标悬浮会显示。 通知范围 是 可多选 选择某一个服务,举例:当选择A服务时,事件单中出现的也是A服务时,不考虑其他匹配规则的情况下,该订阅实例生效,会根据该订阅实例发送通知。
该部分可选。请求消息体通常以结构化格式(如JSON或XML)发出,与请求消息头中Content-Type对应,传递除请求消息头之外的内容。若请求消息体中的参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类
更导致故障以及紧急告警呈现当前运维态势风险情况。PRR评审汇总体现应用上线/转商前的评审情况。通过算法统计影响最严重的Top5事件单,快速识别重大故障场景。指标详情可查看表1。 图3 运维总览 表1 运维总览数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位
安全 责任共担 身份认证与访问控制 审计与日志 服务韧性 认证证书
产品咨询 云运维中心权限如何配置? 如何通过企业项目进行权限控制 创建委托指导