执行命令 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS执行命令功能,您可以在不登录ECS的情况下,发送脚本命令至单台或多台ECS,快速完成对ECS的日常维护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行
查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊
选择异常的脚本工单 单击“强制结束”,结束异常脚本工单。 图3 操作异常的脚本工单 选择一个状态为“执行中”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图4 选择执行中的脚本工单 单击“暂停”或“强制结束”,即可暂停执行或结束脚本工单。 图5 操作执行中的脚本工单
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上
添加备注 使用场景 事件处理过程,若存在事件需要添加额外的备注信息,可使用添加备注的功能。 前提条件 事件受理后才能添加备注。 添加备注 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“... > 添加备注”。
资源列表默认展示资源的部分属性,如果您需要查看应用层级下某个资源的资源详情,可按如下操作查看。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择应用,选择目标实例,单击实例名称。 图1 查看详情 单击下方的“查看资源详情”。
操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表1 转发责任人参数说明
云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。
true:表示演练处于取消正在注入故障的阶段时,会执行rollback()回滚函数中的内容 false:表示演练处于取消正在注入故障的阶段时,不会执行rollback()回滚函数 1. 在"inject_fault"函数中,请添加一个故障注入成功的标志,并于"check_fault_
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。
),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。
可选参数。用户授权云运维中心执行作业所能够使用的权限范围。 ServiceLinkedAgencyForCOC 执行描述 可选参数。对本次作业进行执行描述。 - 标签 可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支持的资源进行扫描检查,发现应用韧性方面存在的风险点;评估的类型有:节点、集群、网络、容灾、容器、业务和数据。 查看报告:提供应用的评估结果,
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
授权产品组合 操作场景 产品组合配置完成后,需要对终端用户授予访问产品组合下所绑定产品的权限,终端用户才可以对产品进行操作。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 授权产品组合
撤销问题 操作场景 问题单创建后,发现提交的问题属于非问题或其他原因问题处理人可撤销问题单。撤销问题单前需要先驳回问题,已受理的问题单不可撤销。 撤销问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“撤销”。
您可以在资源看板快速查看账号下购买的资源(例如弹性云服务器、弹性公网IP、云数据库等),以及资源当前的告警信息(在云监控服务CES配置后产生)。 资源看板 登录云运维中心。 进入COC“总览”后,可以查看对应的资源信息。 图1 资源信息 默认展示全部区域的资源,您可以自定义筛选指定区域查看该区域下的资源。 图2
您即将访问非华为云网站,请注意账号财产安全