正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
韧性中心 混沌演练 应急预案 PRR评审
执行记录 脚本工单 作业工单 补丁工单 资源操作工单 父主题: 任务管理
人员管理 人员管理概述 如何使用人员管理 父主题: 基础配置
批量BMS操作 BMS操作为用户提供了管理BMS实例的能力,支持进行批量开机、关机、重启、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 父主题: 资源运维
通知规则 参数的通知受到期删除时间和修改操作的影响,修改参数内容时需要额外关注下通知规则(在编辑参数时,“参数策略”模块进行配置)。 到期通知 未修改通知 父主题: 参数管理
补丁管理 补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确
自动化运维 补丁管理 脚本管理 作业管理 定时运维 帐号管理 参数管理
资源运维 资源运维概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
当资源关联方式为智能关联时,该参数将被显示,为非必填项。 testValue 关联APM环境 配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息,非必填项。 / 父主题: 应用管理
当资源关联方式为智能关联时,该参数将被显示,为非必填项。 testValue 关联APM环境 配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息,非必填项。 / 父主题: 应用管理
类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。 华为云租户的安全责任在于对使用的 IaaS、PaaS
当资源关联方式为智能关联时,该参数将被显示,为非必填。 testValue 关联APM环境 配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息,非必填项 - 父主题: 应用管理
的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提
巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、
Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。
改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。 图7 故障记录 父主题: 混沌演练
COC结合典型的客户业务场景,总结了几种最佳实践案例,方便您快速加深对COC的认识。 最佳实践 标准化故障管理 一站式资源运维 全旅程混沌工程方案 常见问题 了解更多常见问题、案例和解决方案 热门案例 COC权限如何配置? 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理?
改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准
故障模式 故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景