检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题应用 在下拉列表选择涉及问题的应用。 问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。
前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 创建事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击右上方“创建事件单”。 设置“创建事件单”。
运维概览 操作场景 通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。
故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
访问方式 云服务平台提供了Web化的服务管理平台,即管理控制台和基于HTTPS请求的API(Application Programming Interface)管理方式。
应用排班+轮班场景 使用场景:适用不同应用按照轮班的班次进行排班。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。 登录云运维中心。 在左侧导航栏选择“基础配置 > 排班管理”。
支持按照变更应用、变更级别、状态和变更标题筛选。 若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。 变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。
概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。
所属应用 在下拉列表选择改进单涉及的应用。 改进类型 在下拉列表选择改进类型。 改进责任人 在下拉列表选择责任用户。 改进验收人 在下拉列表选择验收用户。 期望完成时间 请填写期望完成时间。 支持选择到日,时间不得早于今天。 问题现象 请填写事件相关的问题现象。
运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
概述 云运维中心支持对弹性云服务器(ECS)、云数据库(RDS)、Flexus应用服务器L实例(FlexusL)、裸金属服务器(BMS)等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。
1.故障已恢复之前受影响应用必须先走到已恢复状态。 2.WarRoom关闭之前,要填写WarRoom故障信息。 父主题: WarRoom
选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。 默认选择“弹性云服务器ECS”。 单击“导入账号”,设置“导入账号”。
应用排班+固定班次 登录云运维中心。 在左侧导航栏选择“基础配置 > 排班管理”。 在上方下拉列表选择已创建的排班场景(排班场景名称后面会显示“应用排班+固定班次”)。 通过右上方下拉列表快速筛选区域和应用。 区域可用来区分同一个应用在不同区域的排班。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器(ECS)、裸金属服务器(BMS)、Flexus应用服务器L实例(FlexusL)多种云资源。
通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。
您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,您可以根据自身需要,按场景完成各项配置任务,配置完成后,即可在云运维中心对应场景中进行相关运维操作。