已找到以下 374 条记录
AI智能搜索
产品选择
云运维中心 COC
没有找到结果,请重新输入
产品选择
云运维中心 COC
在搜索结果页开启AI智能搜索
开启
产品选择
没有找到结果,请重新输入
会话过期
当前登录超时,请重新登录
  • 概述 - 云运维中心 COC

    概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的

  • WarRoom状态 - 云运维中心 COC

    的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 可以查看WarRoom列表信息。 单击需要查看的WarRoom标题。 页面展

  • 概述 - 云运维中心 COC

    概述 集成配置支持简单、快速集成现有(如华为CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。

  • 概述 - 云运维中心 COC

    概述 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照事件和问题管理流程制定级别的类别的枚举值,便于满足当前业务。 父主题: 流程管理

  • 标准化故障管理 - 云运维中心 COC

    标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。

  • 全旅程混沌工程方案 - 云运维中心 COC

    按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。

  • 构造请求 - 云运维中心 COC

    请求body长度,单位为Byte。 否 3495 X-Project-Id project id,项目编号。请参考获取项目ID章节获取项目编号。 否 如果是专属场景采用AK/SK认证方式的接口请求,或者多project场景采用AK/SK认证的接口请求,则该字段必选。 e9993fc787d94b6c886cbaa340f9c0f4

  • 应用资源管理 - 云运维中心 COC

    应用资源管理 租户委托查询租户的资源信息 父主题: API

  • 概述 - 云运维中心 COC

    概述 SLA(服务等级协议,Service Level Agreement)在业界常用于衡量服务质量,运维中心COC的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户

  • 概述 - 云运维中心 COC

    SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在运维中心COC中,WarRoom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响SLO,COC会自动化地完成SLO的计算,为SLO看板大屏提供数据。

  • 概述 - 云运维中心 COC

    概述 人员管理为运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以

  • 概述 - 云运维中心 COC

    概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则

  • 概述 - 云运维中心 COC

    概述 排班管理为运维中心提供了统一的、多维度、多形式、可自定义的人员管理模式。您可以在排班管理对排班场景进行管理,并将“人员管理”中的人员添加到排班中完成排班的设置。 在需要设置排班人员、获取排班人员时,您直接前往排班管理页面进行配置、查询。 已创建的排班可直接在流转规则、事件

  • 进展通告 - 云运维中心 COC

    进展通告 操作场景 进展通告在故障发生或处理过程将故障处理进展及时同步给相关人员,关注该故障的人可快速掌握故障进展。 进展通告 登录运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“更新通告”。 设置“更新实时通报内容”。

  • 变更管控 - 云运维中心 COC

    变更单必须单击“变更开始”。 开启工单提权后,北向接口无法使用。例如执行脚本开启工单提权,北向调用脚本接口无法使用。 配置变更管控 登录运维中心。 在左侧导航栏选择“变更管理 > 变更管控”。 单击启用工单授权。 启用工单授权默认关闭,支持开启和关闭。开启后列表显示COC的所有操作动作(即Action)。

  • 应用管理 - 云运维中心 COC

    应用管理 概述 创建应用 修改应用 删除应用 应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 查看资源详情 查看容量详情 父主题: 资源管理

  • 自动化运维 - 云运维中心 COC

    自动化运维 补丁管理 脚本管理 作业管理 定时运维 账号管理 参数中心

  • 概述 - 云运维中心 COC

    概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理

  • 概述 - 云运维中心 COC

    概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周

  • 执行记录 - 云运维中心 COC

    执行记录 脚本工单 作业工单 补丁工单 资源操作工单 父主题: 任务管理