检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
获取项目ID 操作场景 在调用接口的时候,部分URL中需要填入项目ID,所以需要获取到项目ID。有如下两种获取方式: 调用API获取项目ID 从控制台获取项目ID 调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目列表API获取。 获取项目ID的接口为“GET ht
故障信息 操作场景 WarRoom启动后,可以查看、编辑故障信息,本节介绍如何管理WarRoom的故障信息。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
WarRoom状态 操作场景 WarRoom启动后,可以查看、更新WarRoom状态,本节介绍如何管理WarRoom的状态。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入
概述 PRR: Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开
移动应用管理 移动应用管理用于管理事件启动Warroom时,创建企业微信Warroom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用管理 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企业微信时,
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
创建脚本 功能介绍 创建作业脚本:自定义脚本 脚本有标签属性,表示是高危脚本。创建时候不需要对脚本进行是否是高危的二次校验。 进行租户隔离;北向接口创建的脚本,审批人字段不填写,默认不需要审批 约束条件: 脚本名称:同一租户下,脚本名称不能重复,最大字符64个字符,支持中文+字母+数字+下划线。
约束与限制 更详细的限制请参见具体API的说明。 父主题: 使用前必读
基本概念 账号 用户注册时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用用户进行日常管理工作。 用户 由账号在IAM中创建的用户,是云服务的
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
变更管理常见问题 常规变更&紧急变更的区别? 变更级别的定义?
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作
批量BMS操作 BMS操作为用户提供了管理BMS实例的能力,支持进行批量开机、关机、重启、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 父主题: 资源运维
改进管理 前提条件 需要通过事件/Warrroom/演练/PRR创建改进单。 处理改进单 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,单击改进标题进入“改进单详情”页面。 图1 改进列表 单击右上角的“处理”或“转发” ,进入处理或转发页面 图2
问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。
创建问题 操作场景 通过Cloud Operations Center创建一个问题单。 前提条件 需要先在应用管理中创建您的应用。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入问题列表页面。单击右上角的“创建问题”,进入创建问题页面。 图1 问题列表 填写创建问题基本信息,点击“提交”。
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
运维态势感知 云运维中心提供运维态势感知的能力,包含变更、事件、告警、安全合规、SLO(服务级别目标)、PRR(生产准备度评估)等多种运维指标数据,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 预置接