检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍
故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。
COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。
评估报告详情中,给出了识别到的风险项,并给出优化建议。 2. 若您认为部分风险项可以不进行优化,则可在查看评估报告详情中,点击“忽略风险”按钮,将其忽略。 父主题: 应用韧性评估
变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。 优先按变更计划开始时间早的排前面 。 计划开始时间相同,按创建开始时间排序。 父主题: 变更管理
无法找到应用管理层级说明页面? 若您未创建应用,您可在“应用管理”页面中找到应用管理层级说明,如图1应用管理层级说明。您在创建应用后,将不再展示应用管理层级说明。 图1 应用管理层级说明 父主题: 资源管理常见问题
故障处理过程中如果识别到一些产品、运维或管理改进事项,可以创建改进单,并通过改进管理处理。 前提条件 需要有正在处理的事件单,在事件处理页面启动WarRoom。 父主题: WarRoom
在评估报告中会给出识别到的风险和优化建议。 1. 当前应用韧性评估,允许评估一个应用下最多100个资源实例。若资源数量超出限制,则会评估失败,并给出相应报错。 2.
通过算法统计影响最严重的Top5事件单,快速识别重大故障场景。指标详情可查看表1。
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的
概述 变更管理主要为构建运维作业全生命周期的安全生产能力,降低变更风险,主要承载变更流程管理业务。包含变更日历、变更中心、变更配置、变更管控等能力。 变更日历:变更日历主要是根据日历视图展示手动创建变更单的数据,并根据不同状态查看变更分布。 变更中心:变更中心主要承载变更流程管理业务
应用拓扑 操作场景 应用拓扑以图形的形式呈现,其中节点表示应用层次结构和资源,连线表示之间的关系。为您更加直观地展示应用层次结构和资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 编辑拓扑仅支持编辑组件之间的连线关系。 编辑拓扑不影响应用和组件的层级和功能。 查看和编辑拓扑
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。
列出组织的可信服务列表 organizations:trustedServices:list 跨账号场景下,查询当前组织已开通的可信服务列表 列出组织的根 organizations:roots:list 跨账号场景下,查询当前组织的root 修改或删除委托权限 若开通COC后,识别到存在委托权限过大或权限不足的情况
与其他云服务的关联 云运维中心COC服务与其他服务的关系,如图1所示。 图1 与其他服务的关系 表1 与其他服务的关系 服务名称 与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板
查看资源拓扑 操作场景 资源拓扑以图形的形式呈现,其中节点表示各种资源,连线表示资源之间的关系。为您更加直观地展示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器
创建委托指导 背景 若您的企业组织存在多个租户账号,您可以使用COC的跨账号能力在创建CES告警规则、执行作业等场景通过一个账号完成多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。
核心优势 动态识别:OS合规性风险动态识别。 资源自动发现和纳管。 安全生产:执行运维操作时,自动分批、爆炸半径评估等。 自动预警:短信、邮件、企业微信等自动通知。 前提条件 执行自动化运维的主机需安装UniAgent。