检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS
概述 云运维中心支持对弹性云服务器 ECS、云数据库 RDS、Flexus应用服务器L实例、裸金属服务器 BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。
操作系统使用限制。
本功能支持集成多个现有或第三方等监控系统(比如CES、AOM、Prometheus),并将业务下分散的告警信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。
√ √ x x coc:instance:reinstallOS 重装弹性云服务器操作系统的权限。 √ √ x x coc:instance:changeOS 切换弹性云服务器操作系统的权限。 √ √ x x 父主题: 资源运维常见问题
快速入门 快捷执行作业 快捷混沌演练 04 API 您可以使用本文档提供的API对COC进行相关操作,例如脚本工单的查询、自定义脚本的增/删/改/查/执行等。
确认作业配置,单击“确定”,进入工单详情页面。 刷新页面,查看作业执行情况。
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键允许包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。
输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。
表2 修改账号基线参数说明 参数 示例 说明 基线账号 账号类型 Linux 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 账号名称 root 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。
手机号码:填写保存后,系统会为该用户在SMN服务创建通知方式为“短信”、“语音”的订阅,该订阅消息会以短信的形式发送到用户终端,需要用户手动确认两条订阅信息后方可生效。
脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。
创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。 执行对象:目标实例,由客户自行选择。
构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。
提升应用高可用能力:PRR(Production Readiness Review 生产就绪程度评审),承载华为云SRE对云应用上线评审的最佳实践,提供在线评审电子流和评审项,提升应用高可用能力。
云运维中心提供了各操作系统的公共补丁基线作为初始弹性云服务器ECS和裸金属服务器BMS场景默认补丁基线,如需使用云容器引擎CCE场景下补丁基线功能请手动创建。 创建补丁基线 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。
熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤9,执行步骤10。 设置“任务类型”。 作业:在下拉框选择选择作业,支持自定义作业和公共作业。