检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。
支持攻击流程自定义编排,配套客户个性化业务场景; 前提条件 已在应用管理中创建应用分组; 进行混沌演练的资源已安装UniAgent; 步骤一:故障模式 确认演练目标主机或容器所属应用,事件级别是否正确。 登录COC。 在左侧菜单栏选择“韧性中心>混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式”。
在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面 选择“自定义作业”页签,单击“创建作业”,进入“创建作业”页面。 图2 单击创建作业 填写作业基本信息,包含作业名称,企业项目,描述和标签。可按照标签管理中的步骤创建标签,填写完成后单击“下一步”。
如何通过企业项目进行权限控制 问题描述 如何通过企业项目进行云运维中心的权限控制。 解决方法 管理员登录IAM控制台。 管理员在权限管理-权限中,单击“创建自定义策略”。 图1 创建自定义策略 设置策略内容,选择允许“云服务操作中心”,并选择要进行企业项目鉴权的操作。单击“确定”完成创建。
本文介绍如何配置流转规则。 前提条件 配置流转规则前,您需要确保集成管理配置流转规则的监控源已成功接入集成。 操作场景 管理流转规则,通过流转规则实现事件、告警等规则的自定义配置。 新增流转规则操作步骤 登录COC。 在左侧导航栏选择“故障管理 > 流转规则”,进入“流转规则”页面。 在流转规则
确认故障模式所属的企业项目、所属应用、事件级别、场景分类是否正确。 操作步骤 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“风险管理 > 故障模式”页签,单击“创建故障模式库”。 图1 故障模式页面 参考表1 故障模式参数说明填写故障模式信息。 图2 创建故障模式 表1
演练记录详情 进入“演练报告”页面,更新报告名称。 图4 演练报告详情 进入演练报告详情页面,输入演练时长,单击“确认”。 图5 编辑演练时长 在“演练报告”页面,单击“创建改进事项”,输入改进事项相关信息,单击“确认”保存创建改进单。改进单后续处理参考改进管理。 图6 创建改进事项 表1
IdentityCenter:user:list 人员管理中同步人员信息 创建主题 smn:topic:create 人员管理中添加通知订阅 查询主题列表 smn:topic:listTopic 故障管理、自动化运维等场景发送通知 更新主题 smn:topic:updateTopic 人员管理中修改通知订阅 查询主题详情
在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,选择待验证状态的改进单,单击改进标题进入“改进单详情”页面。 图3 改进单列表 单击右上角的“验证”,填写验证结论。 图4 改进单验证 改进单历史记录 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理
安全 责任共担 身份认证与访问控制 审计与日志 服务韧性 认证证书
管理排班人员 提供排班人员的查询、修改、删除操作。 操作场景 排班人员发生变化时,可进行修改、删除操作。不同场景修改人员方式不同,具体如下。 全局排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景和排班角色,单击排班“操作”列的“删除”,即可删除排班。
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的时候,PATCH可能会去创建一个新的资源。
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
告警管理 汇聚告警 原始告警 父主题: 故障管理
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
原始告警 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。 图1 问题管理操作流程 父主题: 问题管理