检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
以确保在正式引流时无重大稳定性风险。 解决方案 混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。
提交事件单解决方案 功能介绍 HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num
什么是云运维中心 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。
问题定位出方案中 操作场景 问题单受理后,需要对该问题进行定位分析,并给出定位结果和解决方案。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“定位出方案”,跳转至填写问题原因及解决方案页面,填写信息后点击提交。
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍
产品优势 一站式运维平台 提供集成式运维能力,支持集中管控和运维。 ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。 安全生产、运维
问题待现网实施 操作场景 解决该问题需要涉及变更实施操作。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进
实施及闭环变更单 操作场景 变更单审批后,按照变更方案在规定时间窗内实施变更。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作列“处理”,进入变更详情,点“变更开始”。若变更方案关联的作业,需先执行作业;若是变更指导书,按照变更指导书步骤实施变更。
针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。 步骤四:启动演练 按照已经创建的演练任务,自动化的故障注入。 准备工作 注册账号并实名认证。 在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证。 如果您已开通华为云并进行实名认证,请忽略此步骤。 开通云运维中心。
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
概述 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能:
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
问题流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
产品功能 云运维中心COC提供的常用功能特性参见表1 云运维中心COC功能概览 表1 云运维中心COC功能概览 功能名称 功能描述 发布区域 总览 COC全局总览页面,包含资源总览、资源监控、应用监控、安全概览、快捷入口等多个板块。用户可以在总览页面便捷查看、处理工作项,降低运维复杂度,改善运维体验。
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
给对应机器资源安装UniAgent,用于云运维中心与下层的业务、主机之间的信息交互。 步骤三:执行作业 通过云运维中心,租户可以操作ECS以自动化的方式执行作业。 准备工作 注册账号并实名认证。 在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证。 如果您已开通华为云并进行实名认证,请忽略此步骤。
受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示
Management Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。 标
间在5分钟左右。 同步资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 选择需要同步资源所在的云厂商。 默认选择“华为云”。 同步其他云厂商资源需要先在多云配置接入其他云厂商账号。相关操作请参考接入其他云厂商。 同步阿里云资源操作前提: 需要用户在阿里云中开通“资源中心”服务。