检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
韧性中心常见问题 混沌演练是什么? 支持哪些攻击场景? 故障模式是什么? 演练规划主要做什么? 故障模式和演练任务的关系? 演练报告有哪些内容?
),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。
密钥管理 操作场景 为了更加安全地保护您的主机帐号密码,云运维中心会使用DEW服务来加密您的主机帐号密码。在使用密钥管理之前,请先在DEW创建好密钥。 配置密钥 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 单击右上方“密钥管理”。
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
概述 云运维中心支持脚本管理功能。您可以通过执行脚本,完成复杂或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由
混沌演练 概述 故障模式 演练规划 演练任务 自定义故障 演练报告 父主题: 韧性中心
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
创建委托 在授权列表右上角搜索步骤3-13中创建的策略的名称,选中,点击确定,即完成授权。 图17 委托授权 之后在“委托”列表页找到步骤14-17创建的委托,点击该委托一栏右侧“操作”列中的“编辑”按钮,进入委托编辑页面; 图18 编辑执行租户委托的信任策略1 在“信任委托”ta
流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息,可配置自动通知能力,具体参考通知管理。
配置任务 操作场景 应用韧性评估以应用为粒度的资源进行韧性评估,本节操作介绍配置应用韧性评估任务相关操作步骤。 注意事项 应用韧性评估任务只支持同步一级应用,如果没有合适的应用,可创建新的应用,创建应用详细操作请参考创建应用。 当前最多允许创建32个应用韧性评估任务。当任务达到上
可以通过清除告警功能将汇聚告警从当前告警页签清除,清除后的汇聚告警可以在历史告警页签中查看。 注意事项 只有责任人可以将当前告警进行清除。 告警数据留存期为31天,逾期将自动清除,包含历史告警页签的数据。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理 >告警管理”。 单击“汇聚告警
概述 集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。
短信、企业微信、钉钉、邮件、飞书:选择通知渠道后,按照审核人员预留的信息进行通知。设置审核人员信息详细操作请参考编辑用户信息操作步骤。 不通知:不进行通知。 默认 IAM权限委托 用户授权云运维中心执行作业所能够使用的权限范围。 ServiceLinkedAgencyForCOC 单击“确认”。
如果您需要更新产品的基础信息,可以使用修改产品功能操作。支持修改的信息包括名称、创建人和描述。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCServiceCatalogAdminFullAccessPolicy策略。 操作步骤 登录云运维中心。 在左侧导航栏选择“资源管理
开启后在后续创建脚本中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。 风险等级 脚本的风险等级,可选项“高”、“中”、“低”。 在后续创建自定义脚本中,若选择了审批配置中勾选的风险等级,将会强制填写审批配置中配置的企业项目、审核人和通知渠道。 企业项目 在下拉列表中选择企业项目。
开启后在后续创建作业中,若选择了审批配置中勾选的风险等级,将会强制开启入库人工审核。 风险等级 作业的风险等级,可选项“高”、“中”、“低”。 在后续创建自定义作业中,若选择了审批配置中勾选的风险等级,将会强制填写审批配置中配置的企业项目、审核人和通知渠道。 企业项目 在下拉列表中选择企业项目。
当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤 登录云运维中心。 在左侧导航栏选择“故障管理
别应用存在的风险并给出优化建议,支撑客户提升应用韧性,减少故障造成的影响。 应用韧性主要包含如下功能点: 评估/重新评估:能够自动对应用内支持的资源进行扫描检查,发现应用韧性方面存在的风险点;评估的类型有:节点、集群、网络、容灾、容器、业务和数据。 查看报告:提供应用的评估结果,
补丁基线支持用户自定义配置。用户可通过所设置的补丁基线对实例的补丁进行扫描,修复不符合基线的补丁。 补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器E
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力