检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
传统ITIL(信息技术基础架构库)流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。通过云运维中心的资源管理功能可以将华为云、友商云核心资源和IDC离线资源统一管理,为变更管理、批量运维等功能提供准确、及时、一致的资源配置数据。 父主题: 资源管理
开启后在后续创建脚本中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。 风险等级 脚本的风险等级,可选项“高”、“中”、“低”。 在后续创建自定义脚本中,若选择了审批配置中勾选的风险等级,将会强制填写审批配置中配置的企业项目、审核人和通知渠道。 企业项目 在下拉列表中选择企业项目。
开启后在后续创建作业中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。 风险等级 作业的风险等级,可选项“高”、“中”、“低”。 在后续创建自定义作业中,若选择了审批配置中勾选的风险等级,将会强制填写审批配置中配置的企业项目、审核人和通知渠道。 企业项目 在下拉列表中选择企业项目。
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。 Global 流转规则 流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多
理要求,降低管理成本。 资源管理:同步并纳管用户在云平台上使用的资源实例,构筑资源运维能力底座。 配置管理:提供应用和资源视角的管理能力,以及参数配置集中式看护、全生命周期管理的能力。 合规性管理:资源运维提供批量的补丁扫描修复能力,安全合规先行,兼顾高效。 全方位变更管理 方案
流转规则”。 选择需要修改的规则,单击操作列“更多 > 修改”。 参数信息与创建流转规则基本相同,请参考创建流转规则。 设置完成后,单击“确定”。 完成流转规则修改。 复制规则 登录云运维中心。 在左侧导航栏选择“故障管理 > 流转规则”。 选择需要复制的规则,单击操作列“复制”。
AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。 图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知
发送通知。 支持查看SLA记录,包含工单ID,SLA状态,SLA规则等关键信息。 创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。 自定义SLA优先级高于公共SLA,部分应用优先级高于全部应用。 父主题: SLA管理
故障管理常见问题 生成事件的流程是什么? 怎么能收到事件单通知? Warroom是什么?
本章节为您介绍基于策略授权的授权方法,操作流程如 图1 给用户授予COC权限流程 所示。 前提条件 在授权操作前,请您了解可以添加的COC权限,并结合实际需求进行选择。COC支持的系统策略,请参见基于策略授权模型。若您需要对除COC之外的其它服务授权,IAM支持服务的所有权限请参见系统权限。
在编辑、克隆作业时确定作业的风险等级,并如实填写风险等级。 编辑自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。
问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。
创建应急预案 表1 应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。
或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。角色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。
脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。 校验高危命令:可对脚本内容进行高危检测。 校验范围:检测涉及的高危命令范围,可点击“高危命令说明”查看校验的规则列表。
使用COC服务。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将COC服务的相关操作委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用COC服务的其它功能。
在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。 选择“未解决”将会驳回事件,事件流程重新变为“待处理”。 说明 请填写事件相关说明。
概述 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。