检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
产品功能 产品优势 约束与限制 03 使用 为您讲解COC各类功能的详细操作使用流程,帮助您从0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理
选择需要查看详情的补丁合规性报告,单击“摘要”。 合规-已安装:补丁符合补丁基线,已经安装在ECS实例上,并且没有可用更新。 合规-已安装其他:补丁未包含在补丁基线中,但已安装到ECS实例上。 不合规-已安装待重启:补丁已被修复,但需要重启ECS实例才可生效。 不合规-已拒绝:在补丁基线的补丁例外中被拒绝的补
结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。
Production Readiness Review 生产就绪程度评估基线。 从SLI/SLO、可冗余、可容灾、可过载控制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。
资源操作工单 提供用户查看资源操作工单的能力。 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 通过Cloud Operations Center查看ECS工单、RDS工单、BMS工单、FlexusL工单。 操作步骤 登录COC。
补丁扫描 补丁扫描提供了用户可以扫描目标ECS/CCE/BMS实例上补丁合规性的功能,补丁扫描会根据用户所选择的默认基线、实例、分批执行策略进行合规性报告扫描。 操作场景 通过Cloud Operations Center补丁扫描功能进行ECS/CCE/BMS实例补丁合规性报告分析。
选择需要查看详情的补丁合规性报告,单击“摘要”。 状态说明: 已安装:补丁符合补丁基线,已经安装在ECS实例上,并且没有可用更新。 已安装非基线补丁:补丁未包含在补丁基线中,但已安装到ECS实例上。 已安装待重启:补丁已被修复,但需要重启ECS实例才可生效。 已拒绝:在补丁基线的补丁例外中被拒绝的补丁,该状态的补丁就算满足基线也不会被修复。
资源全生命周期管理,提供资源定义、申请、发放、运维、变配&续期、回收等全生命周期管理,构筑资源管理驾驶舱。 变更风控&作业可信,融合华为SRE安全生产最佳实践的变更管控模型,助力客户作业可信和稳定可靠。 标准化故障管理,加持WarRoom作战驾驶舱,实现故障高效协同和快速恢复。
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
事件单被驳回后为“被驳回”状态,创建人可关闭事件或更新事件信息后重新提交。 事件单被受理后为“已受理”状态,已受理状态下可进行“事件处理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通
转至填写问题原因及解决方案页面,填写信息后点击提交。 图1 填写问题解决方案 解决方案详情页面中若选择需要变更,区域是必填项,问题单走到待现网实施阶段,需要涉及区域关联变更单,具体操作请参考待现网实施章节。 父主题: 处理问题
账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估
最大长度:512 请求示例 查询ECS报告下不合规的报告列表 /v1/patch/instance/compliant?offset=1&limit=10&compliant_status=non_compliant&report_scene=ECS 响应示例 状态码: 200 节点合规性报告信息
版本号 必选参数。 版本管理的版本号 IAM权限委托 必选参数。 执行该定时任务的委托权限 说明: 若选择的任务是公共作业下的ECS开机、ECS关机、ECS重启、OS补丁扫描或OS补丁修复,系统执行时默认使用名为ServiceAgencyForCOC的委托。 风险等级 必选参数。 风险等级有以下三种:
处理事件 驳回事件 驳回后重新提交事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 全链路故障诊断 父主题: 事件管理
流程管理 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照公司事件和问题管理流程制定级别的类别。 事件流程 问题流程 变更场景 父主题: 基础配置
处理问题 操作场景 创建问题单后,问题责任人需受理、定位并提交问题解决方案。 受理问题 驳回问题 问题定位出方案中 问题待现网实施 升降级 挂起问题 待验证 父主题: 问题管理
单击“转发责任人”。 图17 单击“转发”按钮 填写转发信息后,单击“提交”。 图18 填写转发信息 单击“升降级”。 图19 单击“升降级”按钮 填写升降级信息后,单击“提交”。 图20 填写升降级信息 单击“启动warroom”。 图21 单击“启动warroom”按钮 填写warroom信息后,单击“提交”。