检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
改进验收人 改进事项的验收人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 单击”添加会议纪要”,可以添加PRR评审会议的纪要材料 填写完成后,单击”确认”,完成评审纪要录入。 图11 评审纪要录入完成 录入审核结论 登录COC。 在
行两种方式。支持手动事件升降级、转发责任人、查看处理记录、一键启动Warroom等能力。 Global 集成告警 COC集成告警中心,支持将原始告警通过流转规则清洗后,在COC中创建新的集成告警。告警分配到排班或个人,明确告警责任人。支持手动清除、转事件单、自动化处理等操作。 Global
位为分钟。 图10 演练任务基本信息 选择攻击任务,默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组,单击“添加一个新的攻击任务”弹出“添加新的攻击任务”界面。 图11 选择攻击任务 添加新的攻击任务,可以选择创建攻击任务或者选择已有。之前没有创建过攻击任务,需要新建
在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。 父主题: SLO管理
警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。
当前已有资源可自动改密:账号管理-账号基线中配置账号基线。 后续新增资源的自动改密:账号管理-改密策略中配置改密策略。 按照region维度定期改密:账号管理-改密任务添加region。 配置后可查看账号密码、免密登录。 父主题: 账号管理
modifyWarRoomInfo warroom发送通知简报 NotificationBriefing sendNotificationBriefing 添加warroom成员 WarRoom addWarRoomMember 移除warroom成员 WarRoom deleteWarRoomMember
coc:service-name:region:account-id:resource-type:resource-path这个是资源类权限的结构,*代表该层级所有权限,添加资源类权限需要按照这个格式填写 父主题: 参数管理常见问题
端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则,将原始告警清洗为事件单或告警单,帮助用户进行统一的告警管理。当原始告警命中流转规则时,创建事件/告警,并根据排班管理通知对应责任人。责任人可对
在左侧导航栏选择“资源管理 > 应用资源管理”。 单击筛选列右侧,勾选“标签”。 选择目标实例,单击标签列,单击“标签管理”。 图1 标签管理 单击“添加标签”。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键允许包含任意语种字母、数字、空格和_ . : = + -
由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障 通过Cloud Operations
最大长度:100000000 error_msg String 请求响应描述 最小长度:0 最大长度:100000000 请求示例 POST https://IP:PORT/v1/external/incident/handle Request Headers: Content-Type:
单击筛选列右侧,勾选“标签”。 在“自定义作业”页签,选择目标实例,单击标签列,单击“编辑标签”,右侧弹出“编辑标签”页面。 图1 标签管理 单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的评审阶段“产品立项/产品设计/产品上线“,单击“添加检查大类“,右侧显示检查项信息,可以根据需要选择对应的检查项。 图3 制定检查项信息 单击选择检查项的“必要性”级别。 如果必要性为A的检查项不通过时PRR评审将不通过。
查询用户列表 IdentityCenter:user:list 人员管理中同步人员信息 创建主题 smn:topic:create 人员管理中添加通知订阅 查询主题列表 smn:topic:listTopic 故障管理、自动化运维等场景发送通知 更新主题 smn:topic:updateTopic
确保已接入CES监控,请到集成管理进行配置。 已创建事件单。 如果需要展示CCE集群中的负载,pod信息,需要在CCE中对负载进行标签配置(每个分组只能添加一个CCE集群资源,否则不展示负载等信息)。 图1 配置CCE负载标签 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”
登录云运维中心。 在左侧导航栏选择“故障管理 > 诊断工具”,进入“诊断工具”页面。 单击“立即诊断”,进入“创建OS诊断”页面。 单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明 参数 示例 说明 选择方式 手动选择 请选择实例选择方式。 手动选择:根据“企业项目”
最大长度:100000000 error_msg String 请求响应描述 最小长度:0 最大长度:100000000 请求示例 GET https://IP:PORT/v1/external/incident/create Request Headers: Content-Type:
错误码 最小长度:8 最大长度:36 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 实例请求体 https://coc.myhuaweicloud.com/v1/job/scripts { "type" : "SHELL", "content"
itional.xxx表示,AOM相关字段描述点击这里查看 在响应预案部分,选择针对本次流转规则相关联的脚本、作业和应急预案,脚本和作业的添加请参考自动化运维。 脚本、作业和自动化预案支持故障自愈能力,选择脚本作业和自动化预案后会显示“自动执行”勾选项,勾选后带出脚本或作业对应的参数