检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在集成告警列表中勾选告警单,单击“清除”或“批量清除”。 选择“业务是否中断”,如果选择“否”,继续执行步骤五;如果选择“是”,必须填写“故障发生时间”及“故障恢复时间”。此处填写的业务中断时间计入对应应用的SLO中断记录。 图1 清除告警-业务中断 生成SLO中断记录需要先设置对应的SLA规则
变更配置 变更配置概述 承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。 审批配置:支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 审批配置 父主题: 变更管理
变更中心 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 核心能力:当前支持变更管理、变更配置等能力。 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
WarRoom 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。在Warroom页面可以添加与会成员、发送故障进展、添加影响应用等操作。 前提条件 该应用下有正在处理的事件单,在事件处理页面启动WarRoom。 WarRoom状态 故障信息 影响应用管理
权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于华为云各服务之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。角色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。 策略:IAM
云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍 立即使用 立即使用 仅两个按钮时选用
登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“帐号基线”页签,根据业务需求创建基线。 针对未绑定组件的主机,系统默认通过内置的全局基线来纳管主机帐号。用户也可通过“创建帐号基线”方式(推荐)来自定义需要纳管的
应用资源管理 以资源为基础,以应用为中心,将所有资源对象与应用统一管理,为不同业务场景提供多视角资源管理视图,为上层运维场景服务提供准确、及时、一致的资源配置数据。 资源管理 应用管理 多云配置 跨账号资源
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
参考:枚举 事件级别incident_level 最小长度:0 最大长度:255 is_service_interrupt 是 Boolean 业务是否中断,取值:true/false 枚举值: true false incident_type 是 String 事件类别 参考:枚举 事件类别incident_type
单击“选择区域”,勾选需要配置的区域至右选框后,单击“确定”。配置好之后可在“操作”列单击“查看任务详情”查看配置区域的改密任务,也可根据业务需求进行删除。 图1 配置改密任务 至此全部配置工作完成,可至“帐号管理”页签“查询帐号密码”。 父主题: 帐号管理
登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“改密策略”页签,根据业务需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按
通用Region和专属Region,通用Region指面向公共租户提供通用云服务的Region;专属Region指只承载同一类业务或只面向特定租户提供业务服务的专用Region。 详情请参见区域和可用区。 可用区(AZ,Availability Zone) 一个可用区是一个或多个
inc_type_p_monitoring_issues 监控问题 monitoring issues inc_type_p_consulting_issues 业务咨询类 consulting issues inc_type_p_suppliers_issues 供应商问题 suppliers issues
集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 Global 变更管理 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。
图4 标准化故障管理 智能化混沌演练 全旅程混沌工程解决方案,快速评估应用潜在韧性风险,持续看护应用架构。 端到端混沌工程方案:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、演练复盘4个维度,提供端到端混沌演练能力。 故障模式库:首创基于容错视角的故障场景分析方法,沉
校验结果:通过正则校验结果返回脚本内容是否高危,即:低风险、高风险。 高危命令校验结果仅作为脚本风险等级的定级参考,工具不强制拦截脚本风险等级与高危命令校验结果一致性,请按实际业务影响进行评估。 图4 校验高危命令 填写脚本入参,可勾选“敏感参数”对参数进行加密。 图5 填写脚本入参 敏感参数:脱敏展示,存储时会加密存储。
体参考应急预案章节 场景分类 故障属于哪种场景,包括冗余、容灾、过载、配置、依赖 发生条件 故障可能发生的条件 预计故障现象 故障发生时的业务现象 客户影响 故障造成的客户影响 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可
该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”进入新增集成页面。 图1 接入集成 在新增集成页面有对集成的介绍和集成接入步骤,根据步骤进行集成,集成完成后单击底部“确认集成”。
事件类别 参考:枚举 事件类别incident_type parameter.is_service_interrupt 是 Boolean 业务是否中断,取值:true/false parameter.cause 是 String 原因,最大长度:10000 parameter.solution