检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 云运维中心提供了统一操作Flexus L实例的功能。通过批量Flexus L重启功能,您可以对Flexus L实例执行单独或批量重启的操作。 注意事项 所选实例处于运行中或重启状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启
on中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制
批量关机 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS关机功能,您可以对BMS实例执行单独或批量关机的操作。 注意事项 所选实例处于运行中状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量关机 登录云运维中心。 在左侧导航栏选择“资源管理
批量重启 操作场景 云运维中心提供了统一操作BMS实例的功能。通过批量BMS重启功能,您可以对BMS实例执行单独或批量重启的操作。 注意事项 所选实例处于运行中或重启状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源管理
完成影响应用新增。单击受影响应用可以查看该应用的告警、事件和变更信息。 执行预案 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 选择需要处理的应用,单击“执行预案”。 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。 若没有合适的应急预案需要创建,请参考创建应急预案。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 1、需要先在应用管理中创建您的应用。 2、需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 操作步骤
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故
创建委托指导 背景 若您的企业组织存在多个租户账号,您可以使用COC的跨账号能力在创建CES告警规则、执行作业等场景通过一个账号完成多账号多区域的运维任务配置、下发,在此过程中,您需要创建和使用相应的委托,在本章节中,我们将以跨账号创建CES告警规则场景为例,详述如何创建相关委托。
若未解决可不通过,问题处理人重新定位处理,已解决可直接闭环。 验证问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“验证”。 设置“验证”。 是否通过:可选项“通过”、“不通过”。 验证描
可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称 自定义设备的名称。 测试设备 私有IP 虚拟机私有IP。 192.168.1.1 操作系统 在下拉列表选择操作系统。 LINUX UniAgent Id 可选参数。UniAgent唯一标识。 - Ecs Id 可选参数。Openstack生成的唯一标识。
“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义脚本审批。 父主题: 脚本管理
操作场景 用户可以通过此页面查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 查看SLO 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,按下“回车
如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理
设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义作业审批。 父主题: 作业管理
应用诊断 操作场景 当事件创建后,您可以通过应用诊断(全链路故障诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
在发生群体性故障或重大故障时,为快速恢复业务正常运行,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。
审批名称自动生成。 审批人通过排班场景和排班角色决定。 审批方式:一人通过 或 全部通过。 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。 父主题: 集成管理