检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
UDP端口未散列配置 请检查NPU RoCE UDP端口配置情况 影响NPU卡通信性能 系统内核自动升级预警 KernelUpgradeWarning 重要 系统内核自动升级预警,旧版本:%s,新版本:%s 系统内核升级可能导致配套AI软件异常,请检查系统更新日志,避免机器重启 可能导致配套AI配套软件不可用
存储库 √ × × × × 云连接 CC 云连接 √ × × × × 云数据迁移服务 CDM 实例 √ × × × × 内容分发网络 CDN 域名 √ √ × √ × 云防火墙 CFW 云防火墙实例 √ × × × × 表格存储服务 CloudTable 集群ID √ √ × √ ×
数组长度:1 - 100 version_type 否 String 插件升级时需要选择升级“基础版本”还是“增强版本”,传值“BASIC_VERSION”表示升级成基础版本,传值“ADVANCE_VERSION”表示升级成增强版本 枚举值: BASIC_VERSION ADVANCE_VERSION
统计的是当前云服务您所选维度下的资源数据。包含“资源总数”、“正在告警资源数”、“已配置告警资源数”和“7日告警资源数”的统计。 告警统计 该数据统计的是近7天状态为“告警中”的告警级别明细和资源分组告警。告警级别明细中包含对“紧急告警”、“重要告警”、“次要告警”和“提示告警”的统计。
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 修改DNS与添加安全组 Agent安装说明 手动配置Agent(可选) 升级Agent 管理Agent BMS硬件监控插件说明 安装GPU指标集成插件 安装云专线指标采集插件 父主题: 主机监控
系统类型、是否有多个服务器以及个人习惯选择任何一种或多种安装方式: 安装场景 支持的服务 参考章节 控制台界面安装/升级Agent ECS 在控制台界面安装/升级Agent 安装Agent(Linux) ECS、BMS 单台主机下安装Agent(Linux) 安装Agent(Windows)
Agent支持的系统有哪些? 以下列表中系统版本,是经过验证确定可以支持的系统版本,对于其余版本的支持情况,正在验证中。 以下系统都基于华为云IMS服务提供的公共镜像或者公共镜像创建的系统,如果使用未经验证的外部系统,可能会出现依赖问题或引入其他不稳定因素,请谨慎使用。 操作系统
目前支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已成功安装Agent插件。 Linux系统 确认正在使用的Agent版本 使用root账号,登录ECS。 执行如下命令,确认使用Agent的版本。 if [[ -f /usr/local/u
在资源详情部分,单击“名称”列,可查看资源的“监控视图”。 在资源详情部分,在“指标告警状态”列或“事件告警状态”列,单击“未设置告警规则”可跳转到创建告警规则页面,单击“告警中”跳转到告警记录页,查看相应资源的告警结果。 步骤三:资源分组关联告警模板 用户可通过创建资源分组关联告警模板的方式进行批量创建告警规则,提升告警规则配置效率。
购买云服务资源后,在云监控服务查看不到监控数据 用户购买云服务资源后,首先需要确认该服务是否已对接云监控服务,系统正在对接更多的云服务,在此之前用户无法查看到未对接服务资源的监控数据。 如该服务已对接云监控服务,请耐心等待一段时间,由于各个服务采集上报监控数据的频率各有不同,当云
告警状态有哪些? 目前云监控服务支持六种告警状态: 告警中、已解决、数据不足、已触发、已失效、已解决(手动)。 告警中:监控指标数值达到告警配置阈值,资源正在告警中; 已解决:监控指标数值恢复至正常区间,资源的告警已解决; 数据不足:连续三个小时未有监控数据上报,通常是由于相应服务实例被删除或状态异常导致;
云监控服务”。 单击“任务中心”,进入“任务中心”页面。 在“任务中心”页面的“Agent维护”页签可以查看安装、配置与升级Agent的任务信息。 对于Agent升级的任务,若“任务状态”为“成功”,可通过操作列的“回退”将当前的任务插件将回退到原版本;若“任务状态”为“超时”,可通过操作列的“重试”重新执行该任务。
查询监控数据接口如何使用。 解决方法 参考查询监控数据接口文档:查询监控数据。 问题二 问题描述 调用不同region区域的接口,对应的域名是什么。 解决方法 参考文档:地区和终端节点。 常见4XX问题处理 HTTP状态码 429 错误码 ces.0429 可能原因 原因1:API被流控。详见下方【案例一】
问,从而探测远端服务器的可用性、连通性等问题。 服务可用性监控 通过使用广域网功能配置定时HTTP(S)拨测任务,选择分布在全球的探测点对域名进行HTTP(S)拨测,并根据协议拨测结果状态码识别服务的可用性,通过配置监控告警条件,可在出现异常状态时立马告警,并收到服务故障信息。此
port_range,并重启Agent解决此问题。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install
}([0-9A-Za-z]|_|-)*$ invocation_type 否 String 任务类型, INSTALL安装, UPDATE升级, ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target
短信-指标系统通知模板、表2 短信-系统事件系统通知模板和表3 短信-自定义事件系统通知模板所示: 表1 短信-指标系统通知模板 信息 变更操作 告警恢复状态 新增 跳转连接 新增 资源ID 新增 告警状态 保持不变 告警级别 保持不变 告警持续时长 保持不变 告警时间 保持不变 告警流水号 保持不变 当前数据
选择待查看的云服务资源所在行“永久数据存储”列下的指定的OBS桶名称,页面跳转到OBS管理控制台中对应OBS桶的对象管理界面。 或单击页面左侧的“主机监控”,单击待查看的ECS所在行的“永久数据存储”列下的指定的OBS桶名称,页面跳转到OBS管理控制台中对应OBS桶的对象管理界面。 在OBS桶
”界面。 单击右上角“查看资源详情”,弹出“查看资源详情”窗口,可查看该监控的实例名称、实例ID、资源分组情况。 点击待查看的资源分组可以跳转到资源分组详情页面。 父主题: 主机监控
无告警:组内未存在告警资源。 告警中:组内有资源正在告警。 未设置告警规则:组内所有资源均未设置告警规则。 事件告警状态 无告警:组内资源未触发事件。 已触发:组内有资源触发事件。 未设置告警规则:组内所有资源均未设置告警规则。 资源数(告警中/已触发/资源总数) 组内所有正在告警的资源数/已触发告警的资源数/组内所有资源的数量。