检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 事件单处理完成后,通过故障是否恢复或达到预计效果,在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。
应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。 解决方案 混沌演练驱动主动运维:从客户实际业务场景出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模
warroom_id String warroom_id 最小长度:0 最大长度:255 handle_time Long 最后一次提交解决方案时间戳 最小值:1 最大值:9999999999 status String 状态KEY,参考:枚举 事件状态 最小长度:0 最大长度:255
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
编排等运维场景快速引用。 Global 事件中心 COC事件管理系统,可在事件大盘概览全部事件。提供手动处理事件和关联作业执行两种方式。支持手动事件升降级、转发责任人、查看处理记录、一键启动Warroom等能力。 Global 集成告警 COC集成告警中心,支持将原始告警通过流转
资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。 资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使用文件传输能力,需要在对象存储服务中购买存储桶。 执行公共脚本 华为云Flexus云服务 资源运维中,可以对Flexus应用服务器
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题
事件历史记录 操作场景 若需追溯事件处理阶段中某个节点做了什么操作,可以查看事件的历史记录,事件历史记录包含事件的整个处理过程。 事件历史记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 单击上方“全部事件单”。 选择需要查看的事件单,单击事件标题。 单击上方“事件历史”。
如何在不重启实例的情况下重置密码? COC提供了管理员/非管理员账号重置密码的公共脚本,通过该脚本实现重置密码效果,不会重启实例,您可通过执行相应的公共脚本来重置实例(目前支持ECS和BMS资源类型)的密码。 图1 执行重置密码公共脚本 您在COC中执行公共脚本时,需要选择实例,而能够选择到实例的前提条件为:
租户账号下所有ECS,执行过补丁扫描和未执行过扫描的实例数量 未扫描实例=全量实例-扫描实例 区域、应用 个 实例合规性状态 补丁管理 已扫描过的实例中,合规的实例数量和不合规的实例数量 统计补丁管理中各合规性状态的实例数量 区域、应用 个 最近扫描时间 补丁管理 统计已扫描的实例,最近一次的扫描时间区间
创建补丁自动化任务 操作场景 补丁扫描或补丁修复支持创建自动化任务,您可通过自动化任务定时执行补丁扫描或补丁修复作业。 注意事项 补丁自动化任务当前仅支持ECS资源,CCE资源请手动创建扫描或修复任务。 补丁自动化任务可周期性扫描区域下所有ECS资源的补丁合规情况,并根据扫描结果创建待办事项。
转发问题 操作场景 问题单处理过程发现该问题属于其他运维专家处理,可转发问题单给对应的责任人。 转发问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“转发责任人”。 设置“转发责任人”。 表1
进展通告 操作场景 进展通告在故障发生或处理过程将故障处理进展及时同步给相关人员,关注该故障的人可快速掌握故障进展。 进展通告 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“更新通告”。 设置“更新实时通报内容”。
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。
事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
操作场景 对实例进行补丁扫描后,扫描结果展示实例补丁的不合规状态。如果存在不合规的补丁,可以通过补丁修复功能对目标实例上不合规的补丁进行修复。 补丁修复 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。 在“补丁扫描”页签,选择需要修复实例的资源类型。
更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发现、事件处理、恢复验证及持续改进的全流程标准化机制。 承载Warroom和故障回溯能力:现网事件智能启动Warroom,缩短故障处理非必要耗时,指挥中心实时观测故障处理进展。故障回溯
补丁基线不生效? 在使用补丁管理扫描或修复功能前,请确认创建的补丁基线已经设置为默认基线并且使用场景正确。 父主题: 补丁管理常见问题
在“待处理的”页签,选择需要处理的改进单,单击改进单标题。 单击右上方“处理”。 设置“改进处理”。 表1 改进处理参数说明 参数 说明 问题原因 请填写问题发生的原因。 限制长度最长1000个字符。 改进措施 请填写详细的改进措施。 限制长度最长1000个字符。 单击“确定”。 完成改进单处理。 转发改进单