检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
非必填 可多选 选择事件单的区域,多个区域可选 通知方式 必填 可多选 选择通知的渠道 排班场景下多角色会根据人进行去重,但是不同人同一个手机号时,会发送多条相同通知信息;个人场景下处理逻辑同理。 当规则中不设置规则值时,代表不经过该规则匹配,举例:若A规则不设置值时,不考虑其他
给用户授权COC权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予云运维中心只读的系统权限“COC ReadOnlyAccess”,云运维中心服务管理员的系统权限“COC FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限
警规则的用户注意,如不需要发送通知功能,可在配置CES告警规则时关闭发送通知功能。 组织管理员委托 使用组织管理员租户账号登录IAM-新版控制台; 在左侧菜单栏单击“身份策略”,进入“身份策略”列表页,单击右上角“创建自定义身份策略”,为委托创建授权策略; 图3 创建授权策略 进入身份策略创建页面,填写“策略名称”;
填写WarRoom信息后,单击“提交”。 图3 填写WarRoom信息 若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信和钉钉),需要配置以下信息: (1)在移动应用管理中配置对应用。 (2)在人员管理中配置企业微信对应邮箱。 (3)若选择排班,需要先创建排班并给排班中添加排班人员,添加排班和参与者后,会在起会规则命中时拉入企业微信。
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
组织开通之后,跳转到组织管理页面,按照以下步骤创建组织: 1. 组织管理员需要创建一个组织,一个账号只能有一个组织; 2. 成员账号看不到除了控制面板外的东西; 3. 成员账号也必须是企业级账号; 授权COC为可信服务,请参见授权为可信服务。 图2 授权为可信服务 该账号为管理员或者
注意事项 1、当前coc生成的变更管控策略默认仅提供绑定在用户组的功能,请勿将策略用作其他用途; 2、您可以通过coc界面action的编辑按钮来控制相应功能是否开启管控,注意所有操作请在coc完成,切勿直接操作策略。 3、工单提权开启后,策略绑定了用户后,若需要关闭工单提权,需先将用户组中的策略解绑后才能关闭。
脚本管理:COC提供公共脚本和自定义脚本,用户可以自定义创建脚本,支持shell、python、bat三种类型。 作业管理:用户可以将云服务API、公共作业、自定义作业、作业控制编排成自定义作业。 定时运维:定时运维向客户提供了定时或周期性的向特定实例执行特定脚本或者作业的功能。 核心优势 动态识别:OS合规性风险动态识别。
进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。 图2 区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源
执行区域:执行的目标对象所在的区域。 委托名称:IAM中委托对象的名称。 项目ID:IAM中的项目概念,执行的目标对象所在的项目的ID。 位置并发:可选参数。位置并发是控制正在执行的子工单数量,会影响到子工单的最大执行失败数。eg:并发5,则最大错误数为错误阈值 + 5(并发数)。 错误阈值:可选参数。当失败的子工单数大于错误值时作业停止执行。
动场景匹配和规则匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 Global 移动应用管理 用户可绑定或修改移动应用(当前仅支持企业微信)。 Global SLA管理 SLA为客户提供了工单时效管理,当工单触发某一个规则时,及时通知客户
支持的授权项 策略包含系统策略和自定义策略,如果系统策略不满足授权要求,管理员可以创建自定义策略,并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应,授权项列表说明如下: 权限:允许或拒绝对指定资源在特定条件下进行某项操作。 对应API接口:自定义策略实际调用的API接口。
环比和趋势图体现变更整体情况。变更风险根据变更等级、变更方式等分布图,分析变更导致的故障和变更成功率。变更开销统计变更人力和时间趋势,有效控制变更成本。指标详情可查看表2。 图4 变更管理 表2 变更管理数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 变更概览
故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入