检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
行复盘,避免故障再次发生。故障复盘信息包含有故障现象、故障影响、故障处理过程、根因分析、解决方案,同类故障、改进措施等15种以上分析项。 系统默认P1/P2/P3/P4级别的事件和启动了WarRoom所有级别的事件需进行复盘,该规则可在故障复盘规则中修改。 故障复盘 登录云运维中心。
安装探针、执行演练、清理环境三个步骤,系统会自动执行。执行时间视武器的攻击时间而定。 安装探针步骤会在目标机器上部署一个探针,该探针将会运行在系统中用于接收攻击、查询和清除等步骤的武器命令。在演练结束或终止操作后,清理环境步骤将停止其在系统中的所有操作并移除。 图6 攻击进行中 图7
华北-乌兰察布-汽车一(cn-north-11) 西南-贵阳一(cn-southwest-2) 节点(rds.nodes) 数据库代理(rds.proxies) 数据库代理节点(rds.proxynodes) 文档数据库服务 DDS 实例(dds.instances) 华北-北京四(cn-north-4) 华南-广州(cn-south-1)
的方式。 实例 实例是终端用户使用服务目录创建的云资源,可以是单个云资源(例如:一台ECS),也可以是多个云资源(例如:多台ECS、一个数据库、一个VPC等)的组合。 授权 在产品组合中,管理员可以为终端用户授权,以便终端用户在服务目录查看产品组合中的所有产品。终端用户为当前租户下的所有用户。
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
参数详情 操作场景 若想查看参数的详情及版本历史,查看敏感参数值和解密数据,请按如下操作进行。 查看参数详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“参数中心”。 选择需要查看的参数,单击参数名称。 若参数类型为加密文本:单击参数
访客虚拟机的操作系统,虚拟防火墙、API 网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施,包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。
若出现实例不可选,请排查以下三种情况: 该实例UniAgent状态是否正常。 是否为Cloud Operations Center补丁管理支持操作系统。 该实例是否处于关机状态。 创建扫描任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。
实际需求进行选择。COC支持的系统策略,请参见基于策略授权模型。若您需要对除COC之外的其它服务授权,IAM支持服务的所有权限请参见系统权限。 示例流程 图1 给用户授予COC权限流程 创建用户或创建用户组 在IAM控制台创建用户或用户组。 将系统策略附加至用户或用户组 为用户或
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
资源操作工单 前提条件 用户使用ECS操作、RDS操作、BMS操作、FlexusL操作等,系统生成对应的工单。 操作场景 在“资源运维 > 资源批量操作”中执行批量操作任务后,若您需要跟踪和记录任务的执行对象及执行结果,可以在“任务管理 > 执行记录 > 资源操作工单”页面查看。
根据命名规则,自定义基线的名称。 测试基线 基线类型 参数不支持修改,账号基线的类型。 组件基线 基线账号 账号类型 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 Linux 账号名称 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。 root 账号分级
操作场景 系统提供的事件暂停和事件降级默认流程,支持用户自定义事件暂停和降级审批流程,流程修改后可在事件处理页面发起申请和审批。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件审批,可配置事件降级和事件暂停的审批流程。系统默认事件降级无需审批,无事件暂停能力
执行公共脚本 操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。
原始告警 操作场景 原始告警是由多个现有或第三方等监控系统(比如CES、AOM、Prometheus),将业务下分散的告警信息进行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。
云运维中心支持脚本管理功能。您可以通过执行脚本,完成复杂或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由用户自定义
COCReadOnlyPolicy 云运维中心服务只读权限。 系统策略 COCFullAccessPolicy 云运维中心服务管理员权限。 系统策略 表5 常用操作与系统策略的关系列出了COC常用操作与系统策略的授权关系,您可以参照该表选择合适的系统策略。 表5 常用操作与系统策略的关系 操作 COCReadOnlyPolicy
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
补丁自动化任务可周期性扫描区域下所有ECS资源的补丁合规情况,并根据扫描结果创建待办事项。 补丁自动化任务将定时执行选择区域中所有Agent正常运行且操作系统为Linux的ECS实例。 创建补丁自动化任务 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“补丁管理”。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发