检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
默认事件等级定义: P1:核心业务功能不可用,影响所有客户。 P2:核心业务功能受损,影响部分客户,客户核心业务受影响。 P3:非核心业务功能异常报错,影响部分客户业务。 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降。 P5:非系统业务异常,属于客户咨询、请求类问题。
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用COC服务。 根据企业用户的职能,设置不
自定义SLA 操作场景 用户可根据实际业务需要,制定所需工单类型的SLA目标规则、预警规则,以便规范工单责任人在日常工作中及时响应处理工单。 查询自定义SLA 登录COC。 在左侧菜单栏选择“基础配置 > SLA管理”页面。 在“SLA”页面选择“自定义SLA”页签,即可查看自定义SLA列表。
断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3类目前仅支持手动添加。 修正SLO中断记录,主要功能为通过修改中断
您可以使用统一身份认证服务(Identity and Access Management,简称IAM),通过IAM,您可以: 根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建用户或用户组,让员工拥有唯一安全凭证,并使用COC资源。 根据企业用户的职能,设置
选择需要清除的告警,单击操作列“清除”。 设置“清除告警”。 表1 清除告警参数说明 参数 说明 业务是否中断 可选项“是”、“否”。 故障发生时间 仅业务是否中断选择“是”时需要设置。 请填写故障发生的时间。 故障恢复时间 仅业务是否中断选择“是”时需要设置。 请填写故障的恢复时间。 备注 可选参数。请填写备注。
在“自定义脚本”页签,单击“创建脚本”。 设置“基本信息”。 表1 基本信息参数说明 参数 说明 示例 脚本名称 根据命名规则,自定义脚本的名称。 测试脚本 企业项目 在下拉列表中选择脚本归属的企业项目。 default 脚本版本号 请自定义填写脚本版本号。 1.0.0 风险等级 可选项“
"inc_type_p_security_issues", "incident_title": "测试时间单号10001", "incident_description": "测试时间单号10001", "incident_source": "incident_source_manual"
变更配置 操作场景 若需创建变更单,需在变更配置中根据自身业务诉求,从变更类型、变更级别两个维度配置审批流程&审批人。 创建审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,单击“创建审批配置”,进入“创建审批配置”页面。 图1 创建审批配置 填写审批配置内容,单击“提交”。
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。
改密任务 操作场景 根据业务需要,您可以通过运维中心配置需要开启定期改密的区域,改密周期初始默认 0 15 3 ? * * ,表示每天上午3:15执行任务。配置之后,我们将会为每一个区域创建一个定时改密的任务,您可前往管理定时任务查看并修改此任务。 配置改密区域 登录云运维中心。
、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估项,覆盖节点、集群、网络、容灾、容器、业务和数据等六种维度,针对以应用为粒度的资源进行韧性评估,帮助客户提前识别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。
改密策略 操作场景 根据业务需要,您可以通过云运维中心进行策略设置,确保您新增的主机实例也能被定期改密。 改密策略分为全局基线和组件基线。 全局基线改密策略:开启全局维度的改密策略后,所有未绑定组件的增量主机实例将会被定期改密。 组件基线改密策略:开启组件维度的改密策略后,所有被
使能主动运维:通过性能压测、应急演练/混沌工程、韧性评估等主动运维手段提升客户关键业务的质量和韧性。 丰富的故障演练武器:沉淀华为云实践经验,内置50个+演练攻击武器,赋能客户模拟复杂多样的业务受损场景并制定应对策略。 提升应用高可用能力:PRR(Production Readiness
云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知
概述 告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软
故障复盘 操作场景 事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。
手动关联资源 设置“关联资源”。 表1 关联资源参数说明 参数 说明 示例 选择应用下的分组 在下拉列表中选择应用、组件和分组。 测试应用/测试组件/测试分组 资源类型 在下拉列表中选择云厂商、资源类型。 华为云/弹性云服务器ECS/云服务器 资源列表 请选择需要关联的资源。 - 单击“确定”。