检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。 处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。
示例 选择应用下的分组 在下拉列表中选择应用、组件和分组。 测试应用/测试组件/测试分组 资源类型 在下拉列表中选择云厂商、资源类型。 华为云/弹性云服务器ECS/云服务器 资源列表 请选择需要关联的资源。 - 单击“确定”。 关联至该分组下。 父主题: 应用管理
图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准故障处理流程服务化,通过WarRoom实现运维、研发等多兵种协同作战,响应预案提升故障处理效率。 运维知识库:基于历史故障和专家经验构筑运维知识
查看扫描和修复详情 操作场景 补丁扫描和补丁修复的结果又称为补丁合规性报告。如果您需要查看合规性报告中某个补丁的详情,可按如下操作查看。 注意事项 补丁合规性报告只会保留最近的一次扫描或修复记录。 查看补丁详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。
您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息 在云服务选择组件处可切换需要查看的云服务类型。
事件处理过程中,初步定位发现该故障为重大故障或群体性故障,可启动WarRoom攻关,协同各应用专家,可快速恢复故障。 启动WarRoom 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“启动WarRoom”。
成员账号也必须是企业级账号; 授权COC为可信服务,请参见授权为可信服务。 图2 授权为可信服务 该账号为管理员或者委托管理员,如果不是请参照添加委托管理员章节的内容。 图3 添加委托管理员 使用约束 邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
操作场景 通过云运维中心查看安全云脑 SecMaster的安全评分和风险,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑 若您是通过创建IAM3
某电商运维人员在日常工作中发现,云上资源合规性问题突出,OS合规性风险尤为明显,引发客户对云上OS安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自
操作场景 标签管理服务(Tag Management Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。
当前应用韧性评估中,只支持对部分云服务的资源进行评估,若应用中存在不支持的云服务资源,则默认忽略对该云服务的资源进行评估。详情如表1所示。 3. 当前应用韧性评估中,只支持对部分区域内的云服务资源进行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。 表1 应用韧性评估支持的云服务和支持区域
查询补丁合规性报告 功能介绍 分页获取节点合规性报告 URI GET /v1/patch/instance/compliant 表1 Query参数 参数 是否必选 参数类型 描述 enterprise_project_id 否 String 企业项目id name 否 String
场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风
本身的基础功能免费,若后续部分高阶产品能力开始收费,提前30天通知。 云运维中心与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。
请选择目标实例所在云厂商。 华为云 资源关联方式 请选择资源关联方式。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过企业项目和标签的形式,将企业项目下的相同标签资源创建至同一资源分组。 手动关联 区域 在下拉列表中选择区域。 - 企业项目 仅关联方式选择智能关联时需要设置。
产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 PRR评审是一个管理过程,旨在确保产品立项、产品设计、产品上线的过程符合既定的质量标准和要求。在 PRR评审中,用户可以查看 PRR评审列表,并进行相关操作。
集成管理 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。
查询合规性报告详情 功能介绍 分页获取节点补丁详情 URI GET /v1/patch/instance/compliant/{instance_compliant_id} 表1 路径参数 参数 是否必选 参数类型 描述 instance_compliant_id 是 String