检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后的复盘改进,确保系统在各种压力下的表现行为能够确定优化策略。
创建大量到指定IP:Port(服务端)的Socket连接进行消耗,使节点正常请求无法连接到服务端(对服务端处理其他节点的请求可能也有影响),支持故障紧急终止 自定义故障 用户通过自动化运维的脚本创建脚本,通过执行脚本模拟故障发生的情况,支持故障紧急终止。 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器
量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 弹性云服务器(ECS) √ √ √ √ √ √ 云数据库(RDS)
操作场景 启动产品会根据产品模板内容生成相应的云产品资源。启动产品前需要管理员配置产品组合和产品,并对终端用户授权。 注意事项 生成云产品资源可能会产生相应的费用,具体根据各个云产品的实际情况计费。 前提条件 确保您登录的账号拥有终端用户的权限,终端用户权限账号需加入COCServ
区域查看该区域下的资源。 图2 区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。 图4 查询资源信息 单击“查看详情”
源请手动创建扫描或修复任务。 补丁自动化任务可周期性扫描区域下所有ECS资源的补丁合规情况,并根据扫描结果创建待办事项。 补丁自动化任务将定时执行选择区域中所有Agent正常运行且操作系统为Linux的ECS实例。 创建补丁自动化任务 登录云运维中心。 在左侧导航栏选择“资源管理
合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提
变更管理常见问题 常规变更&紧急变更的区别? 变更级别的定义?
对权限最小化的安全管控要求。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。这是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。
终端用户 终端用户可以查询、启动被授权后的产品,生成云资源。 产品 产品是服务目录专有概念,底层是基于Terraform或Json构成的云资源模板。根据Terraform及Json的定义,可以是单个云资源,也可以是多个云资源的组合。 产品版本 每次变更产品的Terraform或Json模板,会产生一个新的产品版本。
资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。
升降级 操作场景 如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级
操作场景 事件单受理过程发现该故障有产品、运维的改进事项,可创建改进单进行跟进处理。 前提条件 事件受理后才能创建改进单。 创建改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“ > 创建改进单”或“创建改进单”。
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤
事件类别 操作场景 系统提供的事件类别名称和业务流程定义的事件类别不符合,支持用户自定义事件类别,修改后可在创建事件页面查看最新的事件类别。 新建事件类别 登录云运维中心。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 事件类别”。 单击“新建事件类别”。 表1
问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询处理记录。 处理记录 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要查看的问题单,单击问题单标题。 单击“处理记录”。 查看问题处理历史记录。 父主题: 问题管理
每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
集成配置支持简单、快速集成现有(如华为云CES、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。 父主题: 集成管理
管理员在用户列表中,单击新建的用户,右侧的“授权”。 图1 IAM用户授权 授权模型选择“角色授权”。 图2 选择授权模型 授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC FullAccess”或“COC ReadOnlyAccess”策略,策略详情可查看COC权限管理。