已找到以下 329 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
  • 故障模式是什么? - 云运维中心 COC

    故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题

  • 受理问题 - 云运维中心 COC

    受理问题 操作场景 问题单创建后,问题责任人分析问题实际情况,若属实则问题责任人受理问题并进行后续处理,完成问题的闭环。 受理问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“受理”。 完

  • 问题定位出方案 - 云运维中心 COC

    选择事件发生的区域,支持多选。 若是否需要现网变更参数选择“需要”,参数为必填。 根因分类 在下拉列表选择问题根因分类。 根因分析 请输入问题的根因分析。 限制长度1-1000个字符。 解决方案 请输入问题的解决方案。 限制长度1-1000个字符。 是否需要现网变更 可选项“需要”、“不需要”。

  • 什么是云运维中心 - 云运维中心 COC

    障回溯实现问题总结和经验沉淀,客户问题不重犯,缩短故障恢复MTTR。 支持响应预案:支持客户对已知故障制定响应预案,通过预案自动化帮助客户处理确定性问题,实现已知问题快速恢复。 故障模式:融合专业风险分析方法和专家知识库,积累故障模式库,帮助客户分析云应用存在的潜在风险、传承运维经验。

  • 应用场景 - 云运维中心 COC

    险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,用户开箱即用。 图5 智能化混沌演练

  • 故障复盘 - 云运维中心 COC

    根因分析参数说明 参数 说明 根因分析 请填写故障的根因分析。 单击“添加文件”上传根因分析件相关附件。 支持最多上传10个文件,支持文件类型:jpg、png、docx、txt、pdf,上传文件不能超过10MB。 设置“监控告警”。 表4 监控告警参数说明 参数 说明 是否优先于客户发现

  • 受理事件 - 云运维中心 COC

    受理事件 操作场景 事件创建后,事件责任人分析事件实际情况,若属实则事件责任人受理事件并进行后续处理,完成事件的闭环。 受理事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“受理”。 完成事件受理,事件状态变更为“已受理”。

  • 运维态势感知 - 云运维中心 COC

    监控告警将告警信息以直观的图表形式展示,使运维人员快速掌握服务的整体状况,监控告警中含告警分析、告警成本、告警质量三个模块,体现告警管理核心指标。告警分析中提供告警总量、告警级别、Top10应用、告警降量和告警趋势等指标,运维主管可通过对历史告警数据的分析,了解服务告警的趋势和模式,发现潜在的性能问题或故障隐患。

  • 混沌演练是什么? - 云运维中心 COC

    混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题

  • 审计与日志 - 云运维中心 COC

    收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户开通云审计服务并创建和配置追踪器后,

  • 故障模式 - 云运维中心 COC

    行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建立故障模式,并将该故障模式应用于日常的混沌演练。 注意事项 确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。

  • 全旅程混沌工程方案 - 云运维中心 COC

    混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析分析应用架构,找出风险点。

  • 概述 - 云运维中心 COC

    处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。

  • 韧性中心 - 云运维中心 COC

    韧性中心 混沌演练 应急预案 PRR评审 应用韧性评估

  • 概述 - 云运维中心 COC

    300+的评估项,覆盖节点、集群、网络、容灾、容器、业务和数据等六种维度,针对以应用为粒度的资源进行韧性评估,帮助客户提前识别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支持的资源进行扫描

  • 创建事件 - 云运维中心 COC

    P1:核心业务功能不可用,影响所有客户。 P2:核心业务功能受损,影响部分客户客户核心业务受影响。 P3:非核心业务功能异常报错,影响部分客户业务。 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降。 P5:非系统业务异常,属于客户咨询、请求类问题。 事件类别 可选参数。在下拉列表选择事件的类别。

  • 故障管理 - 云运维中心 COC

    故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理

  • 变更管控 - 云运维中心 COC

    1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。

  • SLA管理概述 - 云运维中心 COC

    Agreement)在业界常用于衡量服务质量,云运维中心的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义SLA,或使用COC预置的公共SLA规则。 支持事件单/告警单/待办任务/问题单4类工单。

  • 公共SLA - 云运维中心 COC

    公共SLA 操作场景 公共SLA由系统为客户预置,开箱即用,默认为禁用状态,用户可根据需要启用/禁用。 查询公共SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单