检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
变更) 2、变更级别:A级>B级>C级>D级 3、变更场景:支持用户根据业务情况自定义配置 4、变更应用:先选择顶层应用,再选择下层具体的应用范围 5、变更区域:变更区域和变更应用相结合定义变更范围 6、变更计划:以region为维度生成 需要按region配置实施人&配合人;
创建事件 操作场景 通过Cloud Operations Center创建一个事件单。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,单击“创建事件单”,进入“创建事件单”页面。
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
填写WarRoom信息 若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信和钉钉),需要配置以下信息: (1)在移动应用管理中配置对应用。 (2)在人员管理中配置企业微信对应邮箱。 (3)若选择排班,需要先创建排班并给排班中添加排班人员,添加排班和参与者后,会在起会规则命中时拉入企业微信。
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
和应用。 图4 应用固定排班列表 单击列表“操作”列的“编辑”,输入用户名,单击“确定”,可在排班页面查看已添加人员的排班。 图5 应用固定排班添加人员 应用排班+轮班场景 使用场景:适用不同应用按照轮班的班次进行排班。 前置条件:“应用排班”您需要先在应用管理中创建您的应用。 登录COC。
面。在页面右上角可以看到WarRoom状态。 单击最右侧的更新状态按钮,可以更新WarRoom状态到对应的状态。 1.故障已恢复之前受影响应用必须先走到已恢复状态 2.WarRoom关闭之前,要填写WarRoom故障信息 父主题: WarRoom
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
SLO管理 月度应用实际达成的SLO情况 月度SLO实际值=1-(月度应用不可用时长/月度应用总时长)*100%; 单个区域多应用SLO实际值=avg(月度SLO实际值); 多个区域单应用SLO实际值=min(月度SLO实际值); 多个区域多应用SLO实际值=avg(多个区域单应用SLO实际值);
即可清空排班。 图3 全局轮班场景清空人员 应用排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景、区域及应用,单击“操作”列的“编辑”可增加或删除排班人员。 图4 应用固定场景修改人员 应用排班+轮班班次 登录COC。 在左侧导航栏选择“基础配置
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班。 排班维度 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关。 应用排班:排班需按照应用,Region(可选)创建,不同应用排班不同。 提交后会跳转至排班完成页面,单击“排班人员”。不同排班方式会和排班维度组合添加人员
演练监控 应用运维管理 总览页面中支持查看应用监控看板,在应用运维管理中已配置的仪表盘可以在云运维中心中进行展示。故障管理中,支持接入应用运维管理服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同 场景描述:排班场景的详细说明 单击排班场景的“操作”列中“创建排班角色”可为该场景创建排班。
单击右上角“创建SLA”,进入“创建SLA”页面。 图5 创建自定义SLA 填写SLA名称、描述、触发类型、选择级别、应用信息,当选择部分应用时,弹出下拉选择框,支持搜索应用,可多选,可全选,如表1所填写 图6 选择应用 表1 参数说明 参数名称 参数说明 SLA名称 必选参数。 由中文、字母、数字、中划线、
在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号管理”页签,可通过资源视角和应用视角来管理主机。资源视角针对购买的所有主机实例,应用视角针对购买的并已绑定应用的主机。 图1 帐号管理概览 若用户只想托管(只保存作用,不改密)主机帐号密码,可通过“导入帐号”的
按照资源类型汇聚,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域 > 分组 > 资源模型”进行管理,支持按照标签查询资源列表,并提供UniAgent安装能力。
当CPU使用率大于10%或者内存大于200M时,UniAgent客户端将自动重启。 UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。 脚本管理 脚本内容 自定义脚本内容≤4096字节。
改进单。改进单后续处理参考改进管理。 图6 创建改进事项 表1 改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
集成告警中对告警进行处理或转事件处理; 事件中心处理转事件的告警,可进行转发、升降级、启动WarRoom处理。 前提条件 已在应用管理中创建应用分组; 已在人员管理中添加人员信息; 已在排班管理中创建排班。 步骤一:集成管理接入原始告警数据 登录COC。 在左侧导航栏选择“故障管理