检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。 对已添加的用户编辑时,若填写了手机号、邮箱、企业微信、钉钉、飞书等通讯方式,系统后台会为其创建对应的订阅方式,以便于满足后续消息通知的需要。
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。
升降级 操作场景 如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级
改密策略 操作场景 根据业务需要,您可以通过云运维中心进行策略设置,确保您新增的主机实例也能被定期改密。 改密策略分为全局基线和组件基线。 全局基线改密策略:开启全局维度的改密策略后,所有未绑定组件的增量主机实例将会被定期改密。 组件基线改密策略:开启组件维度的改密策略后,所有被
告警管理功能提供告警数据的收集、纳管和处理。 本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,
图2 新建事件审批流程 配置完成后在事件处理页面进行事件降级需要审批,同时支持事件暂停。 图3 事件处理页面 1.事件降级和暂停审批流程配置生效后创建的事件单流程才会生效,配置流程之前不会生效。 2.事件在已受理状态可进行升降级和暂停操作。 3.事件闭环之前需要将升降级和暂停的电子流闭环
根据命名规则,自定义应用的名称。 测试应用 描述 可选参数。对应用进行描述。 - 子应用名称 仅应用结构类型选择大型应用时需要设置。 根据命名规则,自定义子应用的名称。 测试子应用 子应用描述 可选参数。对子应用进行描述。 - 组件名称 根据命名规则,自定义组件的名称。 测试组件 分组名称
号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费,也降低了人工操作导致的遗漏等风险。 视图是一组筛选器,用户可以自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。
给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器
如何使用人员管理 操作场景 人员管理统计了当前华为云账号下的用户和基础信息,通过人员管理功能您可以对用户信息进行编辑,比如修改联系方式和设置通知方式等,具体操作如下。 添加用户 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员
查询改密记录 操作场景 用户配置了账号改密后,主机账号密码会根据配置的周期进行定期改密。您可以通过改密记录功能查看改密的最终结果,并且查看改密成功后账号对应的密码。 获取账号改密记录 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。
默认规则: 启动Warroom的事件单,P1, P2, P3, P4, P5均需复盘; 未启动Warroom的事件单,P1, P2, P3, P4需进行复盘。 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 选择需要修改的规则,单击操作列“修改”。
风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。 故障演练:针对风险分析的结果和应急预案,制定演练方案,进行故障演练。 复盘改进:演练完成后,对演练进行复盘总结,输出演练报告和改进事项。 核心优势 首创基于容错视角的故障场景分析方法(FT-FMEA),逐步内置故障模式300+;
已拒绝:在补丁基线的补丁例外中被拒绝的补丁,该状态的补丁就算满足基线也不会被修复。 待修复:补丁符合基线,但补丁版本低于基线版本。 修复失败:补丁进行了修复操作,但是修复失败。 父主题: 补丁管理
编排能力,一方面设置符合需求云服务资源组合的产品,快速根据产品生成对应的云资源;另一方面实现帮助用户快速部署云资源,协助用户对资源的合规性进行管理。 计费说明 产品组合和产品构成了一个或多个云产品的启动模板,启动产品后生成的云产品实例(例如:虚拟私有云 VPC、弹性公网IP EIP、弹性云服务器
相应报错。 2. 当前应用韧性评估中,只支持对部分云服务的资源进行评估,若应用中存在不支持的云服务资源,则默认忽略对该云服务的资源进行评估。详情如表1所示。 3. 当前应用韧性评估中,只支持对部分区域内的云服务资源进行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。
流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,进行多维降噪;支持每个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及
资源运维中,可以对RDS进行批量操作。混沌演练中,支持对RDS进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。 资源运维 对象存储服务 资源运维中,支持对弹性云服务器进行文件上传和分发,如需使
概述 补丁管理为用户提供管理ECS、BMS或CCE实例上补丁的能力。通过补丁管理,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执
COC通过设置流转规则,将原始告警清洗为事件单或告警单,帮助用户进行统一的告警管理。当原始告警命中流转规则时,创建事件/告警,并根据排班管理通知对应责任人。责任人可对告警进行处理或转事件,定位恢复后,清除告警。对于无法清除的告警,可以转事件进行升级或启动WarRoom处理。形成规范性告警处理流程,避免告警处理异常。