检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
填写事件单基本信息后,单击“提交”。 若责任人中选择不到排班,请先在排班管理中创建排班。 图2 创建事件单 事件等级定义如下: P1:核心业务功能不可用,影响所有客户 P2:核心业务功能受损,影响部分客户,客户核心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报
设备厂家 设备厂家,必填项 -- 操作系统 操作系统(LINUX、WINDOWS),必填项 LINUX 描述 描述,非必填项 -- 父主题: 多云配置
应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“删除”。 图1 删除IDC离线资源 单击“确定”。 父主题: 多云配置
变更中心 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 核心能力:当前支持变更管理、变更配置等能力。 创建变更单 审批变更单 实施及闭环变更单 父主题: 变更管理
提供用户导入IDC离线资源的能力。 操作场景 通过Cloud Operations Center导入线下IDC离线资源。 操作步骤 登录COC。 在“多云配置”页面中单击“IDC离线资源”。 图1 导入IDC离线资源 单击“下载模板”,下载表格模板录入信息。 图2 excel录入信息 单击“添加文件”,添加录入信息后的表格。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
的详情及版本历史。 图1 参数列表 在“参数详情”页面,单击参数值旁边的图标查看敏感参数值,单击“展开”查看标签信息,单击查看解密数据查看所有版本的参数值。 图2 参数详情 父主题: 参数中心
事件管理 事件管理主要是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理 事件流程 创建事件 处理事件 事件历史记录
Center查看资源(包含弹性云服务器、弹性公网IP、云数据库等)。 操作步骤 登录COC。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 打开全局视角,查看所有region的资源信息。 单击图标上的,查询对应资源类型的全部资源信息。 全局视角下,单击图标上的,查询不同region对应资源类型的全部资源信息。
问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。
分布式缓存服务普通用户权限(无实例创建、修改、删除、扩缩容) 所有资源 [包含未来新增项目] 混沌演练中对DCS资源执行故障注入 COCServiceAgencyDefaultPolicy COC服务跨账号访问场景下的服务委托策略 所有资源 [包含未来新增项目] 资源批量操作对ECS、RDS等服务实例重启、切换操作系统
实例无法选择? 实例需要安装UniAgent才能执行自动化运维。 安装UniAgent请参考:安装UniAgent。 父主题: 自动化运维常见问题
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 设置熔断策略。 熔断阈值:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率