检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
情。 (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。 勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。 (可选)若应用有子应用,单击子应用。 应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。 单击应用或子应用下组件。
在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
华北-北京一 目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要
华北-北京一 目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要
您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。 图1 查看风险项
及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 Global 变更管理 变更中心主要承载变更流程管理业务,以变更工单模式,从变更的申请、审批、执行三个大环节管控变更业务,为变更人员、变更管理人员提供统一管理平台。 Global 混沌演练 用户可配置演练模板、攻击模
历史告警显示的是被清除的汇聚告警。当汇聚告警被清除后,您可以在历史告警页签中继续查看汇聚告警的相关信息和处理记录。 注意事项 告警数据留存期为31天,逾期将自动清除。 查看历史告警 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警 > 历史告警”。 查看集成告警列表信息。
事件信息 变更管理 变更管理包含数据概览、变更开销、变更风险三个模块,全方位呈现变更核心指标。数据概览中包含变更时长、成功率、自动化变更率等指标,通过环比和趋势图体现变更整体情况。变更风险根据变更等级、变更方式等分布图,分析变更导致的故障和变更成功率。变更开销统计变更人力和时间趋
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“现网实施”。 设置“现网实施”。 若区域涉及变更,点击操作列关联变更单并进行变更实施。变更单相关操作请参考变更中心。 若区域不涉及变更,点击操作列的“不涉及变更”。 支持添加区域和删除已有区域。 单击“实施完成”。 完成问题单现网实施,问题单状态为“待验证”。
表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会影响SLO,COC会自动化地完成SLO的计算,为SLO看板大屏提供数据。 父主题: SLO管理
后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施”,待现网实施页面需要关联变更单,变更单有回填结果,才能流转至下个步骤。 无需变更的问题或需要变更的问题已有变更结果,问题状态为“待验证”,创建人确认问题是否解决或未解决,未解决可进行驳回。
BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器 ECS √ √ √ √ √ √ 云数据库 RDS
服务的委托。委托用于支持COC服务切换到管理员身份,即保证COC服务可以通过该委托获取到管理员租户的临时安全凭证; 执行账号委托:执行账号(组织中的成员租户)信任COC服务和管理员的委托,必须是IAM 5.0版本的信任委托。委托用于支持管理员切换到执行账号身份进行作业工单创建以及
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级。
其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3类目前仅支持手动添加。 修正SLO中断记录,主要功能为通过修改中断记录中的“不可用起止时间”,自动计算不可用时长。 SLO中断记录 登录COC。 在左侧菜单栏选择“基础配置
提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维。 注意事项 当前只有弹性云服务器ECS的实例支持UniAgent的操作。 操作系统使用限制。 表1 UniAgent支持的Linux操作系统及版本
估。 若评估状态为其他状态,详细操作请参考重新评估。 注意事项 一个应用当前支持最多评估30次,若评估达到上限,再次”重新评估”时,会提示自动删除最老的评估报告,需要用户确认后,才能开启新的评估。 开始评估 登录云运维中心。 在左侧导航栏选择“韧性中心 > 应用韧性评估”。 单击操作列“评估”。
补丁工单 操作场景 在“资源运维 > 自动化运维 > 补丁管理”中执行补丁扫描或补丁修复任务后,若您需要跟踪和记录补丁扫描/修复的执行对象及执行结果,可以在“任务管理 > 执行记录 > 补丁工单”页面查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“补丁工单”页签。