概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。
修改账号基线 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 单击“账号改密”。 单击操作列“修改”。 设置“修改账号基线”。 表2 修改账号基线参数说明 参数 说明 示例 基线账号 账号类型 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 新建事件类别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件类别”。 单击“新建事件类别”。 表1
ecs:cloudServers:start 资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS 资源运维中批量切换云服务器的操作系统 重装弹性云服务器操作系统 ecs:cloudServers:rebuild 资源运维中批量重装云服务器的操作系统 获取云服务器信息
概述 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码,在安全管控下支持无需输入密码可登录linux主机执行命令。账号密码管理、自动改密和免密登录操作如下。
无法找到应用管理层级说明页面? 若您未创建应用,您可在“应用管理”页面中找到应用管理层级说明,如图1应用管理层级说明。您在创建应用后,将不再展示应用管理层级说明。 图1 应用管理层级说明 父主题: 资源管理常见问题
传统ITIL(信息技术基础架构库)流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。通过云运维中心的资源管理功能可以将华为云、友商云核心资源和IDC离线资源统一管理,为变更管理、批量运维等功能提供准确、及时、一致的资源配置数据。 父主题: 资源管理
设置默认基线 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。 单击“补丁基线”。 选择需要设置的基线,单击操作列“设置默认基线”。 完成默认基线设置。 修改补丁基线 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。
主机状态为运行中。 主机中存在基线中配置的账号且账号可登录。 免密登录 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的
描述-英文 请填写当前问题类型对应英文环境的详细描述。 单击“确定”。 完成问题类型创建。 修改问题类型 系统预设问题类型不可修改。 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“问题流程 > 问题类型”。 选择需要修改的问题类型,单击操作列“修改”。 设置“修改问题类型”。
公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 启用/禁用公共SLA 登录云运维中心。 在左侧导航栏选择“基础配置 > SLA管理”。 单击上方“公共SLA”。 选择需要启用/禁用的公共SLA,单击操作列“启用/禁用”。 单击“确定”。
需要审批等场景。支持问题处理人挂起问题单,问题单挂起后默认需创建人审批,若需修改先审批流程,可参考流程管理。 挂起问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“挂起”。 设置“挂起”。
公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源运维 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。
S、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。 公共作业 公共作业是由云运维中心提供几种常见运维场景的解决方案,作业详
事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“启动WarRoom”。 设置“启动WarRoom”。
继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 问题单状态为“被驳回”。 父主题: 问题管理
只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 当前告警”。 选择需要清除的告警,单击操作列“清除”。 设置“清除告警”。 表1 清除告警参数说明
分组关联资源后,若您需要将分组内的资源移动至其它的分组内进行管理,请按如下操作进行。 注意事项 只有资源所属的企业项目与应用所属的企业项目相同时才支持转移。 转移资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择分组,勾选需要转移的资源,单击“转移”。
重新开启事件 操作场景 事件单被驳回后,事件提单人再次确认该故障需要提交,可以修改事件单内容后重新提交。 重新开启事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“重新开启”。 设置“修改事件单”。 表1
您即将访问非华为云网站,请注意账号财产安全