检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能:
如何调用API 构造请求 认证鉴权 返回结果
错误码 错误码 状态码 错误码 错误信息 描述 处理措施 400 COC.00040601 Exist script with same name: test1111_param. 存在相同名称的脚本 修改脚本名称 400 COC.00040701 Internal server
给对应机器资源安装UniAgent,用于云运维中心与下层的业务、主机之间的信息交互。 步骤三:执行作业 通过云运维中心,租户可以操作ECS以自动化的方式执行作业。 准备工作 注册账号并实名认证。 在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证。 如果您已开通华为云并进行实名认证,请忽略此步骤。
排班管理 概述 创建排班 添加排班人员 管理排班人员 排班场景管理 父主题: 基础配置
告警管理 概述 处理告警 告警转事件 清除告警 查看历史告警 原始告警 父主题: 故障管理
集成管理 概述 集成管理 父主题: 故障管理
SLA管理 SLA管理概述 自定义SLA 公共SLA SLA记录 父主题: 基础配置
流转规则 概述 创建流转规则 管理流转规则 父主题: 故障管理
事件管理 概述 创建事件 驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
问题管理 概述 创建问题 驳回问题 重新提交问题 撤销问题 转发问题 受理问题 升降级 挂起问题 问题定位出方案 问题待现网实施 验证问题 问题处理记录 父主题: 故障管理
概述 在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组
图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
诊断工具 OS诊断 父主题: 故障管理
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
资源批量操作 概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容