正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
图1 通知时间小于系统时间 有到期删除策略时,未修改通知时间不能大于到期删除时间。 图2 未修改通知时间大于删除时间 父主题: 通知规则
√ √ x x coc:instance:reinstallOS 重装弹性云服务器操作系统的权限。 √ √ x x coc:instance:changeOS 切换弹性云服务器操作系统的权限。 √ √ x x 父主题: 资源运维常见问题
图4 添加人员 通知管理 通知管理为用户创建通知实例,通知实例包含通知场景及匹配规则条件等,当出现一个运维类工单时,通知模块会启动场景匹配和规则匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 登录COC。
熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”,执行脚本。 图7 “提交”按钮 父主题: 脚本管理
权限添加 帐号与授权 应用资源建模 应用资源建模 基础配置 运维基础配置 04 API 您可以使用本文档提供的API对COC进行相关操作,例如脚本工单的查询、自定义脚本的增/删/改/查/执行等。
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
事件和变更的通知模板为系统内置的,您可以根据你的场景选择通知模板。 创建通知 创建通知规则,事件单、问题单和变更单触发对应场景后会自动发送通知。 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,单击“创建通知”。
图3 填写补丁基线内容 操作系统安装规则填写参数说明见表1 自定义安装规则填写参数说明见表2 表1 操作系统安装规则 类型 可选项 说明 产品 Huawei Cloud EulerOS 全部 Huawei Cloud EulerOS1.1 Huawei Cloud EulerOS2.0
手机号码:填写保存后,系统会为该用户在SMN服务创建通知方式为“短信”、“语音”的订阅,该订阅消息会以短信的形式发送到用户终端,需要用户手动确认两条订阅信息后方可生效。
若用户在OS上新增了主机帐号,在帐号管理页面勾选对应主机后,可通过“同步帐号”按钮一键同步新增的OS帐号。注意:若想新增的帐号参与纳管改密,还需在帐号基线中配置该帐号。
构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
提升应用高可用能力:PRR(Production Readiness Review 生产就绪程度评审),承载华为云SRE对云应用上线评审的最佳实践,提供在线评审电子流和评审项,提升应用高可用能力。
OS诊断 登录COC。 在左侧菜单栏单击“故障管理 > 诊断工具”,在“OS诊断”模块单击“立即诊断”,进入“创建OS诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。
如表4 COC系统策略所示,包括了COC基于策略授权中的所有系统策略。策略授权的系统策略与角色授权的系统策略并不互通。 表4 COC系统策略 系统策略名称 描述 策略类别 COCReadOnlyPolicy 云运维中心服务只读权限。
集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。
批量ECS操作 ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。 批量开机 批量关机 批量重启 重装操作系统 切换操作系统 父主题: 资源运维
在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补丁管理依赖的二方包并且功能无损,否则可能会导致执行失败。 补丁管理现支持操作系统以及版本号表1。 补丁管理现依赖的环境见表2。
表1 常用最佳实践 实践 描述 标准化故障管理 建立标准化的事件流程,实现规范性处理 全旅程混沌工程方案 对系统进行混沌演练,通过演练结果检验和提升系统的可用性 一站式资源运维 检查主机操作系统(OS)补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损
批量BMS操作 BMS操作为用户提供了管理BMS实例的能力,支持进行批量开机、关机、重启、重装操作系统等操作。 批量开机 批量关机 批量重启 批量重装操作系统 父主题: 资源运维