检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持攻击流程自定义编排,配套客户个性化业务场景; 前提条件 已在应用管理中创建应用分组; 进行混沌演练的资源已安装UniAgent; 步骤一:故障模式 确认演练目标主机或容器所属应用,事件级别是否正确。 登录COC。 在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。
事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 创建事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击右上方“创建事件单”。 设置“创建事件单”。
运维效率。 图1 COC产品介绍 统一资源管理 应用管理:提供应用和资源关联关系建模能力,满足用户云上资源的集中式管理要求,降低管理成本。 资源管理:同步并纳管用户在云平台上使用的资源实例,构筑资源运维能力底座。 配置管理:提供应用和资源视角的管理能力,以及参数配置集中式看护、全生命周期管理的能力。
RDS、Flexus应用服务器L实例、裸金属服务器 BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器
单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪 图2 应用资源统计数据 单击“待处理事件”、“待处理
概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周
PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段 PRR评审要发起的评审阶段 期望完成时间 PRR评审期望的完成时间
责任人可以选择多个。 排班创建好后,在“排班”页面,选择排班场景和时间段,可以查看排班中的人员。 应用排班+固定班次场景 使用场景:适用不同应用,排班人员是全天固定的。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。 登录COC。 在左侧导航栏选择“基础配置 > 排班管
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
分布和详情,支持按月和日展示,具体操作如下。 查看日历 登录云运维中心。 在左侧导航栏选择“变更管理 >变更日历”。 页面默认显示本月审批后的变更分布,单击变更标题可进入变更单详情页面。 支持按照变更应用、变更级别、状态和变更标题筛选。 若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。
间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。
设置“镜像”。 公共镜像:常见的标准操作系统镜像,所有用户可见。包含操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 私有镜像:用户基于云主机或者外部镜像文件创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建云主机,可以节省您重复配置云主机的时间。
设置“镜像”。 公共镜像:常见的标准操作系统镜像,所有用户可见。包含操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 私有镜像:用户基于云主机或者外部镜像文件创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建云主机,可以节省您重复配置云主机的时间。
无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重装操作系统 登录云运维中心。 在左侧导航栏选择“资源管理 > 资源批量操作”。 选择“Flexus应用服务器L实例 > 重装操作系统”。 单击“添加实例”,设置“选择实例”。 表1 选择实例参数说明 参数 说明
操作场景 WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。
本,完成复杂或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由用户自定义创建并管理,脚本支持“Shell”、“P
同步账号 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。