检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。
单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新增影响应用”,弹出“新增影响应用”页面。 根据页面提示,设置新增的影响应用信息。 单击“确定”完成添加。 图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。
查看SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。
、可自定义的人员管理模式。您可以在排班管理页面创建排班场景、排班角色,并将“人员管理”中的人员添加到“排班场景”、“排班角色”中完成排班的设置。 Global 通知管理 通知管理为用户创建通知实例,通知实例包含通知场景及匹配规则条件等,当出现一个事件单时,通知模块会启动场景匹配和
单击“+添加任务”,为步骤添加任务。任务添加完成后,单击“完成”。所有任务添加完成后,单击“确定”。 图11 添加任务 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。 云服务API:包含ECS相关操作原子、执行API和等待API调用结果。ECS操作详见:ECS操作。
问题级别:必填,选择问题级别,当前包含致命,严重,一般和提示 问题类型:必填,选择问题的类型 责任人:必填,选择责任人后该问题会流转至对应的责任人名下。当前支持排班和个人,若需设置排班,参考排班管理 问题管理若需要收到通知提醒,需要在通知管理中配置通知规则,具体操作详情参考通知管理。 父主题: 问题管理
填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择commandType (命令类型) :SHELL、PYTHON或BAT。设置executeUser (命令执行用户)、timeout (命令执行超时时长(秒)) 、successRate (成功率阈值(%)) 、commandContent
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
coc:parameter:* 自动化运维引用参数中心的参数 获取服务器密码对 ecs:serverKeypairs:get 重装、切换操作系统,设置密码对 获取服务器密码对列表 ecs:serverKeypairs:list 重装、切换操作系统,查询密码对列表 批量关闭云服务器 ecs:cloudServers:stop
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
运维态势感知 云运维中心提供运维态势感知的能力,包含变更、事件、告警、安全合规、SLO(服务级别目标)、PRR(生产准备度评估)等多种运维指标数据,从宏观到微观全面呈现运维全局态势,提供企业级运维沙盘。 面向不同角色运维人员的专属运维BI看板,辅助运维优化改进和洞察决策。 预置接
义故障脚本,则需要创建脚本。 图2 选择攻击场景为自定义故障 1. "超时时间":用于限制脚本允许执行的最长时间,超时时间设置需要比脚本执行时间更长,建议设置比脚本执行时间至少超过30秒。 创建自定义故障脚本,可以单击“脚本管理”,会跳转到“自动化运维 > 脚本管理 > 自定义脚
单击“更新通告”,根据页面提示,填写完通报内容,单击“确定”,可以更新通告。 图1 更新通告 单击“发布”,根据页面提示,填写完发送信息,单击“确定”,可以发布通告。 若通报对象中选择排班,请在排班管理中创建排班。 父主题: WarRoom
该原子动作可以用来调用某个云服务注册在API Explorer上的OpenAPI。如果OpenAPI是一个异步调用,可以使用等待API结果原子动作来等待目标对象达到预期状态。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。 图1 作业管理页面
您可以从地区和终端节点获取。 scope参数定义了Token的作用域,下面示例中获取的Token仅能访问project下的资源。您还可以设置Token的作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 1 2 3 4 5
等待API结果 该原子动作可以用来等待目标对象达到预期的状态。如通过执行API原子动作调用ECS的StartServer接口后,再通过等待API结果原子动作调用ECS的ShowServer接口,直到接口响应中的状态变为ACTIVE,即状态为运行中,才判定ECS实例已经启动成功。 操作步骤
用的,支持关闭该规则。 2.流转规则生成汇聚告警,在窗口期内若没有收到原始告警,系统会将之前窗口期内的告警作为历史告警(即当前告警状态默认设置为“已处理”) 图4 流转规则转事件/告警示意图 触发条件中key说明如下: key参数 描述 对应CES告警字段 对应AOM告警字段 alarmId
路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 请求参数 无 响应参数 状态码: 200 表2 响应Body参数