检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。 故障演练:针对风
本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
全链路故障诊断 操作场景 当事件创建后,您可以通过全链路故障诊断,快速定位故障根因。我们面向客户应用提供应用层、组件层、资源层的关系拓扑,实现基于资源和应用告警的异常染色,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
受理事件 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击“受理”。 图2 受理事件 父主题: 处理事件
添加备注 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“添加备注”。 图2 添加备注 填写备注信息后,单击“提交”。 图3 填写备注信息 父主题: 处理事件
自定义”,单击“下一步”,进入“作业编排”页面。 设置“作业编排”。 单击,在步骤前后添加新步骤。 单击步骤名称或者步骤名称右侧,修改步骤名称。 单击步骤名称右侧,删除步骤。 单击“+添加任务”,为步骤添加任务。 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。
韧性中心优化 全生命周期风险管理:覆盖部署态和运行态两部分的风险治理,贯穿应用和资源全生命周期,将华为云多年沉淀的动态清零风险管理经验使能用户。 使能主动运维:通过性能压测、应急演练/混沌工程、韧性评估等主动运维手段提升客户关键业务的质量和韧性。 丰富的故障演练武器:沉淀华为云实践经验
如何调用API 构造请求 认证鉴权 返回结果
故障管理 事件管理 WarRoom 集成管理 父主题: API
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
WarRoom 支持创建WarRoom和查询WarRoom信息的接口 创建Warrom 查询WarRoom信息 父主题: 故障管理
补丁管理 查询补丁合规性报告 查询合规性报告详情 父主题: API
脚本工单 展示脚本工单基本信息 展示批次列表 展示实例状态统计信息 展示批次详情 展示工单列表 操作脚本工单 父主题: API
修订记录 日期 修订记录 2023-11-30 第一次发布 2024-06-06 随服务版本刷新资料内容
批量RDS操作 批量开启 批量停止 批量重启 父主题: 资源批量操作
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
告警管理 告警管理概述 查看告警 处理告警 告警转事件 清除告警 历史告警 原始告警 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 集成管理 父主题: 故障管理
资源管理 资源管理 应用管理
总览 为用户提供资源健康度、资源监控信息、安全概览、运维态势感知、系统公告等相关信息,呈现基于资源一站式的信息概览,同时您可通过总览页面右上角“自定义设置”灵活配置页面楼层的展示和排序。 运维概览 快速配置中心 资源看板 资源监控 优化顾问 安全评分 运维态势感知