检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息
在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。 点击右上方“收藏配置”。 设置“收藏配置”。 企业项目:勾选需要收藏的企业项目。 单击“确认”。 单击“确定”。 完成企业项目收藏。 查看已收藏企业项目的资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
单击问题单标题。 单击右上方“定位出方案”。 设置“定位出方案”。 表1 定位出方案参数说明 参数 说明 问题应用 默认创建问题选择的应用。在下拉列表选择涉及问题的应用。 是否为共性问题 可选项“是”、“否”。 发现问题版本号 可选参数。请输入问题对应的版本号。 区域 可选参数。
创建或修改SLA后,将对新进入SLA流程的工单开始生效,对已处于SLA流程中的工单不会生效。 自定义SLA优先级高于公共SLA,部分应用优先级高于全部应用。 父主题: SLA管理
OM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。
说明 与会方式 可选参数,可选项“企业微信”、“钉钉”、“飞书”。 选择的与会方式会自动选择相应的通知方式。 请先在移动应用管理中配置应用,人员管理中配置应用对应邮箱。 通知方式 可选参数,可选项“短信”、“电话”。 支持多选,“企业微信”、“钉钉”、“飞书”三种通知方式由选择的与会方式自动关联。
PRR评审的主要功能包括发起 PRR评审、 PRR模板管理。 PRR评审可以通过“发起 PRR评审”进入发起页面,填写基础信息如评审名称、描述、应用名称、应用责任人等,并选择相应的 PRR模板和检查项信息。评审过程中,用户可以上传自检材料,并在评审完成后录入评审纪要。对于需要改进的检查项,用户可以创建改进事项。
设置“告警转事件”。 表1 告警转事件参数说明 参数 说明 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择故障应用。 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。 严重程度默认“P1”最严重,“P5”最轻微。 业务是否中断
多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,您可以根据自身需要,按场景完成各项配置任务,配置完成后,即可在云运维中心对应场景中进行相关运维操作。
运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门
新增账号后,需要同步资源,同步当前账号下现有资源。 已有账号的资源产生变化,需要重新同步资源。 新增其他云厂商账号 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击右上方“多云配置”。 单击对应云厂商。 设置“新增账号”。 表1 新增账号参数说明 参数 说明 账号ID 请填写云厂商的账号ID。
WarRoom 概述 WarRoom状态 修改故障信息 影响应用管理 与会成员 进展通告 起会规则 父主题: 故障管理
资源管理 资源管理 应用管理 服务目录
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
创建改进单”或“创建改进单”。 设置“创建改进单”。 表1 创建改进单参数说明 参数 说明 改进单名称 自定义改进单的名称。 所属应用 在下拉列表选择改进单涉及的应用。 改进类型 在下拉列表选择改进类型。 改进责任人 在下拉列表选择责任用户。 改进验收人 在下拉列表选择验收用户。 期望完成时间
单击“关联单号”,选择对应工单。 发生时间 可选参数。请填写问题发生的时间。 问题应用 在下拉列表选择涉及问题的应用。 问题级别 可选项“紧急”、“严重”、“一般”、“提示”。 紧急: 造成系统或应用程序崩溃、死机、系统挂起,或造成数据丢失,主要功能完全丧失,导致本模块或相关模块异常等。
韧性中心 混沌演练 应急预案 PRR评审 应用韧性评估
人员管理。 发送方式 可选项“短信”、“企业微信”、“钉钉”、“飞书”、“电话”。 “企业微信”、“钉钉”、“飞书”需要先在移动应用管理中配置相应应用。 通报内容 不支持修改,内容为最新通报内容。 单击“确定”。 完成通告发布。 父主题: WarRoom
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理