检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。
传统ITIL(信息技术基础架构库)流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。通过云运维中心的资源管理功能可以将华为云、友商云核心资源和IDC离线资源统一管理,为变更管理、批量运维等功能提供准确、及时、一致的资源配置数据。 父主题: 资源管理
概述 流转规则可将接收的原始告警进行去重操作,通过配置触发规则和触发条件,将原始告警转成汇聚告警或事件。每个流转规则配置时支持分配给排班或者多个责任人,从而实现更准确的通知,同时转事件支持故障自愈。 父主题: 流转规则
补丁基线不生效? 在使用补丁管理扫描或修复功能前,请确认创建的补丁基线已经设置为默认基线并且使用场景正确。 父主题: 补丁管理常见问题
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
变更级别的定义? 变更级别是对变更风险可量化的定义,变更A级风险最高,其次是变更B级、变更C级、变更D级。 父主题: 变更管理常见问题
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪 图2 应用资源统计数据 单击“待处理事件”、“待处理告警”、“我的待办”,可跳转至相应的运维事务。
时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自execute
应急预案”页面,选择“公共预案”页签。 图2 公共预案页面 单击操作列的“克隆”按钮,即可克隆应急预案。 图3 克隆应急预案 克隆保存成功后,克隆的应急预案会展示在自定义自定义预案页签下面的表格中 图4 克隆成功后的应急预案展示 父主题: 应急预案
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 - 分 0~59 * / 任务的执行间隔大于30分钟。
支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
源请手动创建扫描或修复任务。 补丁自动化任务可周期性扫描区域下所有ECS资源的补丁合规情况,并根据扫描结果创建待办事项。 补丁自动化任务将定时执行选择区域中所有Agent正常运行且操作系统为Linux的ECS实例。 创建补丁自动化任务 登录云运维中心。 在左侧导航栏选择“资源管理
最小长度:8 最大长度:64 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 查询ECS报告下不合规的报告列表 /v1/patch/instance/compliant?offset=1&limit=10&compliant_status=n
错误码 最小长度:8 最大长度:64 error_msg String 错误描述 最小长度:2 最大长度:512 请求示例 请求指定报告下的补丁信息 /v1/patch/instance/compliant/3f5f3c944f50da3a7038457c5ff76c66?offset=1&limit=10
请确认ECS实例上有是否有lsb_release命令包,若没有,则安装相应命令包。 2.若ECS实例上有lsb_release命令包,则确认使用的UniAgent版本是否高于1.1.0版本,若高于1.1.0则降UniAgent版本为1.1.0以下重试。 父主题: 补丁管理常见问题
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理