检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
展示脚本工单基本信息 功能介绍 查询执行:基本信息 执行类型、执行名称、创建人、创建时间、结束时间、执行状态、标签(脚本id,脚本名,执行脚本参数,执行用户,超时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid}
展示批次列表 功能介绍 查询:批次列表 返回:批次index、批次标签 URI GET /v1/job/script/orders/{execute_uuid}/batches 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(
改进管理 前提条件 需要通过事件/Warrroom/演练/PRR创建改进单。 处理改进单 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,单击改进标题进入“改进单详情”页面。 图1 改进列表 单击右上角的“处理”或“转发” ,进入处理或转发页面 图2
根据选择的公共作业类型。 若选择“ECS”、“OS”开头的公共作业,执行步骤9-10。 若选择“RDS”、“DCS”开头的公共作业和“分布式消息服务Kafka_生命周期管理_重启实例”,执行步骤11。 若选择其他公共作业,执行步骤12。 单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明
示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。 在左侧导航栏选择“资源管理
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
事件状态 status KEY 中文名称 英文名称 incident_draft 草稿 DRAFT INCIDENT_STATUS_TRIGGERED 未受理 TRIGGERED INCIDENT_STATUS_ACKNOWLEDGED 已受理 ACKNOWLEDGED INCI
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
问题待现网实施 操作场景 解决该问题需要涉及变更实施操作。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进
身份认证与访问控制 身份认证 用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,
问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。
点击“确认”,完成Config服务开通。 AK/SK所对应的账号需添加Action。 创建策略:进入“IAM”服务,选择“策略”,点击“创建策略”,选择服务“EC2”,筛选操作并勾上“DescribeRegions”,点击“添加更多权限”,选择服务“Config”,筛选操作并勾上
密钥管理 操作场景 为了更加安全地保护您的主机帐号密码,云运维中心会使用DEW服务来加密您的主机帐号密码。在使用密钥管理之前,请先在DEW创建好密钥。 配置密钥 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“账号管理”,进入“账号管理”页面。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
使用前必读 概述 调用说明 终端节点 约束与限制 基本概念