检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
展示实例状态统计信息 功能介绍 查询:实例状态统计信息。 URI GET /v1/job/script/orders/{execute_uuid}/statistics 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id
受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
查看资源拓扑 提供用户查看资源拓扑关系的操作。 操作场景 通过Cloud Operations Center查看资源拓扑关系。 注意事项 目前仅支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)以上四种资源的拓扑关系。
创建视图 提供用户创建视图的能力,用户可自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 操作场景 通过Cloud Operations Center创建视图。 注意事项 最多支持创建 10 个视图。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,单击“跨账号资源”。
原子动作 原子动作定义了一个具体的操作内容,是作业的最小单位。 执行API 等待API结果 执行内容 父主题: 作业管理
驳回事件 操作场景 创建的事件不合理时,事件处理人可驳回事件。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 待处理事件列表 单击“驳回”。 图2 驳回事件 填写驳回原因,单击“确定”。 图3 填写驳回原因
升降级 操作场景 创建人提交问题后,若问题处理人认为当前问题级别不合理,可对问题单进行升降级操作。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“升降级”,页面会显示问题挂起弹窗页面,并填写挂起信息。
改密任务 配置改密区域 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密任务”页签,配置需要开启定期改密的区域。单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作
操作脚本工单 功能介绍 操作类型:取消实例、跳过批次、取消整个工单、暂停整个工单、继续整个工单 URI PUT /v1/job/script/orders/{execute_uuid}/operation 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是
身份认证与访问控制 身份认证 用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,
帐号管理 账号管理为用户提供针对华为云ECS、RDS、中间件等资源实例的人机帐号密码集中管理能力。多种帐号进行统一收口,避免多资源帐号密码易遗忘、多人知晓密码信息易泄漏等风险,用户可通过帐号管理来获取主机密码 图1 资源帐号管理流程 按照资源帐号管理流程完成相关配置后,方可从帐号管理页面获取到主机密码。
跨账号资源 前置条件 在Cloud Operations Center进行跨账号资源的操作之前,用户需要满足一些前置条件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
补丁管理 补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
新增起会规则 操作场景 WarRoom拉起会议通过起会规则拉起,本节介绍如何创建起会规则。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在起会规则列表上方,单击“新建起会规则”,输入规则