检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本章节指导用户为Linux系统的主机添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,其他主机步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。
本章节指导用户为Linux系统的ECS或BMS添加域名解析并添加安全组,防止下载Agent安装包与采集监控数据时出现异常。本章节以ECS为例介绍如何修改DNS和添加安全组,BMS操作步骤类似。 修改ECS的DNS配置有两种方式:命令行和管理控制台。您可以根据自己的使用习惯选择其中一种方式进行配置。
支持GPU监控的环境约束 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些? 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。 已安装lspci工
日志监控提供了针对日志内容的实时监控能力。通过云监控服务和云日志服务的结合,用户可以针对日志内容进行监控统计、设置告警规则等,降低用户监控日志的运维成本,简化用户使用监控日志的流程。 事件监控 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到云监控服务,并在事件发生时进行告警。
smart-log-add <nvme设备名>命令采集。 网口状态信息 包含网口的MAC地址、链路状态、接收/发送端的丢包&错包计数。 使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。
net_tcp_sys_recv (Agent) TCP SYS_RECV状态的连接数量。 该指标用于统计测量对象服务器端收到的请求连接的TCP数量。 采集方式(Linux):通过/proc/net/tcp文件获取到所有状态的TCP连接,再统计每个状态的连接数量。 采集方式(Windows):通过WindowsAPI
修改prometheus中的prometheus.yml文件配置。如下配置所示在scrape_configs下新增job_name名为“huaweicloud”的节点。其中targets中配置的是访问cloudeye-exporter服务的ip地址和端口号,services配置的是你想要监控的服务,比如SYS
业务端口被Agent占用该如何处理? 云监控服务的Agent插件会使用HTTP请求上报数据,使用过程中会随机占用动态端口,范围取自/proc/sys/net/ipv4/ip_local_port_range。若发现使用的业务端口与Agent使用的端口冲突,可以修改/proc/sys/ne
软件关闭。 操作步骤(单节点安装) 安装命令参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 操作步骤(多节点批量安装) 参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 安装lspci工具 登录弹性云服务器。 更新镜像源,获取安装依赖。
根据Agent安装路径判断当前Agent版本,方法参见管理Agent(Windows)。 卸载当前版本的Agent,卸载命令参见卸载Agent。 安装最新版本的Agent,安装命令参见操作步骤。 父主题: 升级Agent
图1 配置站点监控的告警内容 表2 站点监控的告警内容配置 参数 参数说明 告警类型 告警规则适用的告警类型。 维度 用于指定告警规则对应站点的维度名称。 探测协议 目前可探测四种协议进行监控:HTTP(S)、PING、TCP、UDP。 监控范围 告警规则适用的资源范围,可选择资源分组或指定资源。
Appliance)是基于内存计算技术的高性能实时数据计算平台。云平台提供了高性能的IaaS层服务,能够满足SAP HANA需求,帮助用户在云平台上快速申请SAP HANA所需的资源(HANA云服务器、公网IP地址等),并安装和配置SAP HANA,从而提升用户的效率,降低用户的成本,提升用户的体验。 HANA云服务器是指专门为SAP
操作场景 本章节主要介绍如何在单台主机中手动安装Agent,为用户提供主机的系统级、主动式、细颗粒度的监控服务。 约束与限制 目前只支持Linux操作系统和Windows操作系统。支持的系统请参见Agent支持的系统有哪些?。 前提条件 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
NPU当前存在故障,可能导致客户业务终止 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NV Peer
NPU当前存在故障,可能导致客户业务终止 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NV Peer
如何修改告警通知中云账号联系人和主题订阅者的电话、邮箱等信息? 云监控的告警通知对象可以是“云账号联系人”也可以是主题的订阅者。 下面为您介绍当通知对象分别是“云账号联系人”或主题的订阅者时的电话和邮箱修改方法。 云账号联系人为告警通知对象时 当您设置的告警通知联系人为“云账号联系人”时
Value:用户ID 云解析服务的监控指标说明 CDN与智能边缘 智能边缘小站 SYS.IES Key:site_id Value:边缘小站ID 智能边缘小站的监控指标说明 内容分发网络 SYS.CDN Key:domain_name Value:域名 内容分发网络的监控指标说明 视频 视频直播
已配置委托,配置方法参考如何配置委托?。 确保操作步骤中的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。 登录方式为账号密码:已收集需要安装Agent的所有主机的IP地址和root用户密码,按照iplist.txt格式整理好,并上传到第一台机器的/usr/local目录下 iplist
根据需要可选择通知组或主题订阅两种方式。 通知组 需要接收告警通知的通知组。创建通知组请参见创建通知对象/通知组。 通知对象 需要发送告警通知的对象,可选择云账号联系人或主题。 云账号联系人为注册时的手机和邮箱。 主题是消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题则需先创建主题并订阅该主题,该功
资源概览界面显示当前分组中包含的资源类型、每个类型下包含的资源总数、维度、资源告警状态。 操作步骤 登录管理控制台。 在管理控制台左上角选择区域和项目。 单击“服务列表 > 云监控服务”。 单击页面左侧的“资源分组”,进入“资源分组”页面。 单击资源分组列表中的其中一个分组名,进入分组资源概览界面。