检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云网络互访性能 云网络互访性能是一个全面展示华为云各个区域间和某个区域下的可用区之间的访问时延的界面,旨在帮助用户在搭建服务时选择合适的区域或者可用区,从而实现最佳的互访性能。注意区域间的时延在选择的两个区域之间有云连接的时候,代表是云连接通道的访问性能,如果没有则是走互联网通道
操作步骤(单节点安装) 安装命令参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 操作步骤(多节点批量安装) 参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 安装lspci工具 登录弹性云服务器。 更新镜像源,获取安装依赖。
已成功安装Agent插件。 确认正在使用的Agent版本 使用管理员账号,登录ECS。 查看安装路径,确认使用Agent的版本。 老版本Agent安装路径为“C:\Program Files\telescope”,手动配置Agent操作请参考操作步骤(老版本Agent)。 新版本Agent安装路径为“C:\Program
据源。 具体操作请参考将监控数据导出到自建Prometheus/Grafana。 云监控会定期更新Exporter版本,如果您有新的功能需求,下载并重新安装配置新版本Exporter即可。 父主题: 接入Prometheus/Grafana
云产品监控指标 全局级服务的监控数据默认保存在华北-北京四,如需要查询数据,请在华北-北京四查看。 分类 服务 命名空间 维度 监控指标参考文档 计算 弹性云服务器 SYS.ECS Key:instance_id Value:云服务器ID 弹性云服务器的基础监控指标 弹性云服务器中操作系统监控
包含盘的基本信息。(SN、型号、容量、协议类型、固件版本等),以及盘的SMART log中的各项指标(健康状态、温度、坏块计数、各类错误和失败计数等)。 使用smartctl -a <盘符>命令采集。 NVMe SSD 基本信息 包含NVMe盘的基本信息。(SN、型号、容量、固件版本等) 使用nvme list命令采集。
美-墨西哥城一,其余都属于新架构。 将${download_url} 替换成表1中的下载路径,将${version}替换成Agent版本特性中的版本,将${regionID}替换成表1中的regionID。例如,用北京一下载地址替换${download_url},对应的安装命令为:
API API版本号 云资源监控 资源配额 事件监控 告警 资源分组
云监控插件(Agent) Agent安装配置方式说明 Agent版本特性 Agent安装说明 安装配置Agent 管理Agent 其他插件安装说明 升级Agent 父主题: 主机监控
最小值:1111111111111 最大值:9999999999999 current_version String 当前版本 最小长度:1 最大长度:64 target_version String 目标版本 最小长度:1 最大长度:64 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code
权限和授权项 策略和授权项说明 API版本号管理接口授权项说明 指标管理接口授权项说明 告警规则管理接口授权项说明 监控数据管理接口授权项说明 配额管理接口授权项说明 事件监控接口授权项说明
业务入口的可用性及响应时间。 针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CDN、AS、安全服务、RDS、ELB、OBS
创建告警规则等。 表1 接口说明 类型 子类型 API 说明 API V1 API版本号管理 查询API所有版本 查询云监控支持的API所有版本号。 查询API指定版本号 查询云监控API指定版本号。 指标管理 查询指标列表(ListMetrics) 查询系统当前可监控指标的列表。
中Status值获取每个进程的状态,进而统计各个状态进程总数。 不支持 空闲进程数 该指标用于统计测量对象处于空闲状态的进程数。 ≥ 0 测量对象:云服务器或裸金属服务器 通过统计 /proc/pid/status 中Status值获取每个进程的状态,进而统计各个状态进程总数。 不支持 僵死进程数
2016-12-30 第七次正式版本。 本次变更如下: 新增Web应用防火墙监控指标说明。 主机漏洞检测监控指标说明。 2016-10-29 第六次正式版本。 本次变更如下: 弹性负载均衡监控指标说明中新增监控指标。 2016-9-30 第五次正式版本。 本次变更如下: 新增分布式缓存服务监控指标说明。
Agent插件状态显示“已停止”该如何处理? Agent插件状态显示“运行中”但没有数据该如何处理? Agent一键修复后无监控数据问题排查(老版本Agent) 如何获取Agent的Debug日志? Agent安装成功后管理控制台没有操作系统监控数据或者显示数据滞后 监控数据中会出现跳点的情况
站点监控功能可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 云服务监控功能在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规
com在华为云内网DNS下解析到的IP后再添加对应的hosts。华为云提供的内网DNS地址请参见华为云提供的内网DNS地址是多少?。 请将Agent升级为最新版本,详情请参考升级Agent。 父主题: 主机监控
硬件出现ECC问题,需要隔离 重启GPU进行自动隔离 GPU功能可能异常 GPU当前内核版本和安装驱动时的内核版本不一致 gpuKernelVersionInconsistencyAlarm 重要 GPU当前内核版本和安装驱动时的内核版本不一致 先尝试修复方案: rmmod nvidia_drm rmmod
”页面的“Agent维护”页签查看。 对于Agent升级的任务,若“任务状态”为“成功”,可通过操作列的“回退”将当前的任务插件将回退到原版本;若“任务状态”为“超时”,可通过操作列的“重试”重新执行该任务。 图4 Agent维护 父主题: 安装Agent(Linux)