检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
主机监控 针对众包平台中使用的ECS和BMS,ECS作为业务的计算资源,数据库部署在BMS上。因此,BMS的磁盘速度会影响数据库操作速度,ECS的内存和CPU占用大小等会影响业务执行速度,为了监控更细颗粒度的监控指标,可以在弹性云服务器中安装配置Agent。 具体监控指标方面,可
写操作耗时、网络入流量、网络出流量、队列消息数等关键指标。 商用 分布式消息服务 Kafka支持的监控指标 分布式消息服务 RabbitMQ支持的监控指标 2020年04月 序号 功能名称 功能描述 阶段 相关文档 1 支持云专线网络质量指标 检测云专线端到端的网络质量,主要包含网络时延和丢包率两个指标。
包含网口的MAC地址、链路状态、接收/发送端的丢包&错包计数。 使用ifconfig <网口名>命令采集。 网口设备信息 包含网口的端口类型、Link状态、速率。 使用ethtool <网口名>命令采集。 网口驱动信息 包含固件版本、驱动版本、总线号。 使用ethtool -i <网口名>命令采集。 光模块信息
如果2中返回old agent,代表当前Agent为老版本,卸载命令参见卸载Agent(老版本)。 如果2中返回版本号,代表当前Agent为新版本,卸载命令参见卸载Agent(新版本)。 安装最新版本的Agent,安装命令参见操作步骤。 父主题: 升级Agent
使用root账号,登录ECS。 执行以下命令,切换至Agent安装路径的bin下。 cd /usr/local/uniagent/extension/install/telescope/bin 修改配置文件conf.json。 执行以下命令,打开配置文件conf.json。 vi
在浏览器地址栏输入表1中的下载路径,下载并保存安装包。 进入安装包存放目录。 根据安装包的格式选择相应的操作方式进行插件安装。 若安装包为zip格式 如果安装包是telescope_windows_amd64.zip,解压zip安装包后双击执行“install.bat”脚本,安装启动Agent。 若安装包为exe格式
ort_range。 请执行如下命令,重启Agent。 Windows系统下: 在Agent安装包存放目录下,先双击执行shutdown.bat脚本,停止Agent,再执行start.bat脚本,启动Agent。 Linux系统下: 执行以下命令查看telescope的PID。 ps
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
gpu硬件、驱动、应用问题导致Xid事件,可能导致业务异常退出。 nvidia-smi命令卡住 nvidiaSmiHangEvent 重要 nvidia-smi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 NPU: 存在不可纠正ECC错误
txt格式为“IP地址”,每个保持一行。 示例如下所示: 192.168.1.1 192.168.1.2 确保已下载Agent安装包,获取包的方式如下: 表1 获取Linux批量安装Agent的安装包 区域 regionID 下载路径 华北-北京一 cn-north-1 https://uniagent-cn-north-1
Agent未安装,安装方法参考《云监控服务用户指南》中的“Agent安装说明”章节。 Agent已经安装,委托未配置,委托配置方法参考如何配置委托?。 Agent已经安装,网络配置异常,修复方法参考修改DNS与添加安全组(Linux)、修改DNS与添加安全组(Windows)。 已停止: Agent被手动停止,启动插件方法参考管理Agent。
服务端会认为是无效指标,导致上报的指标被丢弃。 修复方法(Linux) 使用root账号登录主机,确认当前主机ntp服务正常,然后执行以下命令: ntpdate -u ntp.myhuaweicloud.com 或使用其他ntp服务器替换ntp.myhuaweicloud.com
路径。若未指定,程序将默认使用执行启动命令所在目录下的日志配置文件。 metrics_conf_path: "/root/metric.yml" # 可选配置,指定指标配置文件路径,建议使用绝对路径。若未指定,程序将默认使用执行启动命令所在目录下的指标配置文件。 endpoints_conf_path:
置异常”。 约束与限制 当前章节的修复方式只支持新版本Agent,若Agent版本为老版本,建议先升级到新版本。 查看当前Agent版本的命令为: if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope
查看主机监控数据需购买弹性云服务器,请参见自定义购买弹性云服务器。 网络监控 网络监控展示当前弹性公网IP和带宽的出网带宽与入网带宽最近1小时的网络速率,方便您了解网络使用情况。 入网带宽:统计测量对象入云平台的网络速度。 出网带宽:统计测量对象出云平台的网络速度。 查看网络监控数据需申请VPC并绑定EIP或带宽,请参见创建虚拟私有云和子网。
选择“服务列表 > 计算 > 弹性云服务器”。通过VNC方式登录Windows弹性云服务器。 打开“控制面板 > 网络与共享中心”,单击“更改适配器配置”。 右键单击使用的网络,打开设置,配置DNS。 图1 添加域名解析地址(Windows) 不同区域nameserver不同,详细请参考华为云提供的内网DNS地址是多少?
景云监控服务为您提供线下自动导出工具,根据配置实时获取云资源监控数据并持续导入本地Prometheus。 前提条件 请保证线下环境与云监控网络互通。 操作步骤 下载、安装并配置CES Exporter。 具体操作请参考安装配置CES Exporter。 下载、安装并配置Prometheus。
lescope进程不会被其他软件关闭。 操作步骤(单节点安装) 安装命令参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 操作步骤(多节点批量安装) 参见操作步骤,需要替换安装命令中,-t后的版本号为支持GPU采集的插件版本号。 安装lspci工具 登录弹性云服务器。
系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节会导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。站点监控可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 针对电商平台使用的RD
可提供对ECS、VPC、ELB等资源的监控,及时发现异常并通知用户处理。 众包平台 众包平台最佳实践 众包平台作为知识工作者共享平台,利用互联网来将工作分配出去,连接雇主和服务提供者。在华为云部署的众包平台的经典架构图中,BMS与ECS的运行状态对整体业务至关重要,CPU、内存、