检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
问题定位出方案 操作场景 问题单受理后,需要对该问题进行定位分析,并给出定位结果和解决方案,便于后续回溯。 定位出方案 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案
删除实例 操作场景 启动产品生成实例后,如果需要删除,请按如下操作进行。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServiceCatalogEndUserFullAccessPolicy策略。 删除实例 登录云运维中心。 在左侧导航栏选择“资源管理
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
授权产品组合 操作场景 产品组合配置完成后,需要对终端用户授予访问产品组合下所绑定产品的权限,终端用户才可以对产品进行操作。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 授权产品组合
SLA管理概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义
应用场景 运维态势感知BI 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 指标项丰富:预置接入30个+运维指标,构建7张运维态势感知大屏,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 图1 运维沙盘 资源全生命周期管理 提供资源定义、申请、发放、运维
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 Token认证:通过Token认证调用请求。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
管理自定义作业 操作场景 自定义作业创建后,若需要审批、编辑、克隆或删除作业,请按如下操作进行。 注意事项 在编辑、克隆作业时确定作业的风险等级,并如实填写风险等级。 编辑自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理
挂起问题 操作场景 问题单受理后,在定位阶段若需要创单人协助提供数据或其他信息;问题实施阶段变更需要审批等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在
策略授权的示例 如果您需要对您所拥有的COC进行策略授权系统权限的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建用户或用户组
常规变更&紧急变更的区别? 概念上的区别 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。
角色授权的示例 如果您需要对您所拥有的COC服务进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上限时
审批配置 操作场景 审批配置是在创建、修改脚本时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的脚本进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审核时
查询合规性报告详情 功能介绍 分页获取节点补丁详情 URI GET /v1/patch/instance/compliant/{instance_compliant_id} 表1 路径参数 参数 是否必选 参数类型 描述 instance_compliant_id 是 String
审批配置 操作场景 审批配置是在创建、修改作业时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的作业进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审核时
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用
升降级 操作场景 如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级