检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以
补丁基线拥有弹性云服务器ECS、云容器引擎CCE和裸金属服务器BMS三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器ECS和裸金属服务器BMS场景默认补丁基线,如需使用云容器引擎CCE场景下补丁基线功能请手动创建。 创建补丁基线
规性问题突出,OS合规性风险尤为明显,引发客户对云上OS安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自动化的完成OS补丁的扫描,并且
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 集成管理 父主题: 故障管理
执行公共脚本 操作场景 公共脚本是云运维中心提供的预定义脚本,用户对公共脚本具有只读和执行权限,具备一些常见的功能,如清理磁盘、重置密码、启动或关闭操作系统等。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。 执行公共脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。
查看账号基线 √ √ 创建账号基线 x √ 策略授权系统权限 COC服务支持基于策略授权的授权模型。如表4 COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy
资源运维中批量启动云服务器 切换弹性云服务器操作系统 ecs:cloudServers:changeOS 资源运维中批量切换云服务器的操作系统 重装弹性云服务器操作系统 ecs:cloudServers:rebuild 资源运维中批量重装云服务器的操作系统 获取云服务器信息 ecs:servers:get
登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>问题类型,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 问题类型 若不使用系统预置的问题类型,可将是否开启列表中开关关闭。若需要新增问题类型,单击“新增问题类型”,添加问题类型信息。添
变更场景 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不使用系统预置的变更场景,可将是否开启列表中开关关闭。若需要新增变更场景,单击“新增变更场景”,添加变更场景信息。添
操作类型 说明 云服务API 启动ECS操作系统 可以对ECS实例执行单独或批量开机的操作。 重启ECS操作系统 可以对ECS实例执行单独或批量重启的操作。 切换ECS操作系统 可以对ECS实例执行单独或批量切换操作系统的操作。 关机ECS操作系统 可以对ECS实例执行单独或批量关机的操作。
登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面事件流程>事件类别,当前页面显示的为系统预置的事件类别,不支持编辑和删除。 图1 事件类别 若不使用系统预置的事件类别,可将是否开启列表中开关关闭。若需要新增事件类别,单击“新增事件类别”,添加事件类别信息。添
问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“现网实施”,跳转现网实施页面,系统会默认带出涉及的区域,填写区域对应的变更单后,系统会获取变更结果;若部分区域不涉及变更,可点击操作列的“不涉及变更”。 填写完变更信息后,单击右下角的“实施完成”,会走到待验证阶段。
源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
移动应用管理 操作场景 移动应用管理用于管理事件启动Warroom时,创建企业微信Warroom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用管理 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企
支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot
状态前,若又满足流转规则不再会产生事件---该规则是默认启用的,支持关闭该规则。 2.流转规则生成汇聚告警,在窗口期内若没有收到原始告警,系统会将之前窗口期内的告警作为历史告警(即当前告警状态默认设置为“已处理”) 图4 流转规则转事件/告警示意图 触发条件中key说明如下: key参数
实际需求进行选择,COC支持的系统权限,请参见COC权限。若您需要对除COC之外的其它服务授权,IAM支持服务的所有权限请参见系统权限。 示例流程 图1 给用户授权COC权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予云运维中心只读的系统权限“COC ReadOnly
流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。 设置排班,并给排班中添加排班人员,具体参考排班管理。 集成监控系统,自动上报告警信息,具体参考集成管理。 配置流转规则,根据流转规则生成事件,具体参考配置流转规则。 若事件生成后,想要接收到事件的通知信息
算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该
心业务受影响 P3:非核心业务功能异常报错,影响部分客户业务 P4:非核心业务功能异常报障,业务时延增大、性能下降,客户体验下降 P5:非系统业务异常,属于客户咨询、请求类问题 父主题: 事件管理