检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
根据企业的业务组织,在您的华为云账号中,给企业中不同职能部门的员工创建IAM用户,让员工拥有唯一安全凭证,并使用COC服务。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将COC服务的相关操作委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。
添加排班人员 前提条件 设置排班人员前,您需要在人员管理中完善您的人员列表,并且需要创建完成排班场景和对应的排班角色。 操作场景 不同排班方式和排班维度添加排班人员会有所不同,具体介绍如下。 排班类型 固定班次 轮班(周一 -- 周日) 全局排班 全局排班+固定班次场景添加排班人员
操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“升降级”。 设置“升降级”。 表1 升降级参数说明
单击“查看详情”将会跳转至ECS云服务的实例基本信息页面。 图5 查看资源详情 单击资源名称左侧箭头可展开全部告警信息(来源于CES),单击告警规则名称将会跳转至CES对应的告警规则页面,单击“告警自动处理”将会打开COC执行响应预案页面,可快速处理告警。 图6 查看告警 单击右上角“刷新”按钮,可实时同步资源与告警信息。
WarRoom 概述 WarRoom状态 修改故障信息 影响应用管理 与会成员 进展通告 起会规则 父主题: 故障管理
故障管理 诊断工具 告警管理 事件管理 WarRoom 改进管理 问题管理 流转规则 集成管理
Procedure,简称SOP),将变更方案明确并电子化,经评审后归档。支持规则和流程解耦,保证变更执行过程不走样,同时将变更方案沉淀。 变更审批:按照预设审批流程审批变更单,保障变更方案可靠性、时间合理性、流程合规性。 风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变
如何使用人员管理 操作场景 人员管理统计了当前华为云账号下的用户和基础信息,通过人员管理功能您可以对用户信息进行编辑,比如修改联系方式和设置通知方式等,具体操作如下。 添加用户 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
概述 服务目录功能基于RFS(资源编排服务)提供的资源编排能力,一方面设置符合需求云服务资源组合的产品,快速根据产品生成对应的云资源;另一方面实现帮助用户快速部署云资源,协助用户对资源的合规性进行管理。 计费说明 产品组合和产品构成了一个或多个云产品的启动模板,启动产品后生成的云产品实例(例如:虚拟私有云
补丁管理常见问题 补丁基线不生效? 补丁基线中安装规则基线与自定义基线的区别? 补丁工单日志中出现all mirrors were tried异常如何处理? 机器无法选择? 补丁修复后合规性报告仍然为不合规如何处理? 补丁操作出现lsb_release not found异常如何处理?
若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。 变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。 优先按变更计划开始时间早的排前面 。 计划开始时间相同,按创建开始时间排序。 父主题: 变更管理
单击上方“点击此处”或“定时运维” 。 设置“配置自动定时任务”。 表1 配置自动定时任务参数说明 参数 说明 示例 任务类型 可选项“扫描任务”、“修复任务”。 扫描任务和修复任务触发时会按照当前设置的默认基线执行。 扫描任务 执行时间 以时间表达式设置。详细使用方法请参考Cron表达式使用。
进展通告 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“更新通告”。 设置“更新实时通报内容”。 表1 更新实时通报内容参数说明 参数 说明 通报模板 可选项“首次通报”、“进展通报”、“恢复通报”。 通报内容 根据选择的通报模板填写通报内容。
题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 问题管理流程 问题被创建后状态为“未受理”,未受理状态可对问题单受理、驳回或转发责任人。 问题受理
op5事件单,快速识别重大故障场景。指标详情可查看表1。 图3 运维总览 表1 运维总览数据字典 模块 指标名称 数据来源 指标定义 计算规则 统计周期 度量单位 总览数据 事件 事件中心 统计事件单的数量趋势 选择时间周期内,所有事件单的数量 天/月 个 告警 告警中心 统计汇聚告警的数量趋势
“手动安装UniAgent”页面 UniAgent安装完成后,单击 “返回自动安装”。 单击“设置安装机”,设置刚才完成UniAgent安装的机器为安装机。 图4 设置安装机 在弹框中填写设置安装机相关信息,单击“确认”。 图5 确定安装机 父主题: 资源管理常见问题
在“待处理的”页签,选择需要验证的改进单,单击改进单标题。 单击右上方“验证”。 设置“结论验证”。 表3 结论验证参数说明 参数 说明 改进验证 可选项“通过”、“驳回”。 驳回理由 仅改进验证选择“驳回”时需要设置。 请填写驳回的详细理由。 单击“确定”。 完成改进单验证。 改进单历史记录
人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门 以快捷执行作业及快捷混沌演练为例,帮助您快速了解COC在典型场景下的操作方法。
在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。 设置完成后,单击“提交”。 完成自定义作业编辑。 克隆自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。