检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。 下载GPU驱动,推荐驱动链接:
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。 下载GPU驱动,推荐驱动链接:
systemctl stop edgecore systemctl stop edgedaemon 更换显卡,重新安装显卡驱动,然后拷贝驱动文件,具体请参见安装并配置GPU驱动文件。 启动边缘agent服务。 systemctl start edgecore systemctl start
GPU设备检查 功能 检查节点是否存在gpu设备,gpu驱动是否安装且运行正常。 语法 edgectl check gpu 参数说明 无 使用示例 检查节点GPU设备: edgectl check gpu 检查成功返回结果: +-----------------------+ |
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
和“运行中”两者之间不断跳动。 GPU驱动异常 解决方法: 安装GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至11.0版本对应的驱动。 下载GPU驱动,推荐驱动链接: https://www.nvidia
息。边云消息的使用请参见边云消息概述。 默认监听lo(localhost)和docker0两个本地网卡,您可以通过指定网卡名或IP地址设置需要监听的网卡,还可以增加其他需要监听的网卡或IP地址。 图2 边缘节点基本信息(2) 当前支持配置边缘节点的系统日志和应用日志。 系统日志:
如果文件不存在,说明您没有安装NPU驱动,请前往安装NPU驱动。 6、GPU类型边缘节点未安装GPU驱动 如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至11.0版本对应的驱动。 安装GPU驱动。
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
String GPU memory大小,单位MB 表9 Nics 参数 参数类型 描述 interface String 边缘节点网卡名称 ip String 上述网卡对应的IPv4地址 表10 UpgradeHistory 参数 参数类型 描述 id Integer 节点升级或安装历史版本id
请参见设备孪生工作原理和边云消息概述。 默认监听lo(localhost)和docker0两个本地网卡,您可以通过指定网卡名或IP地址设置需要监听的网卡,还可以增加其他需要监听的网卡或IP地址。 图2 边缘节点基本信息(2) 当前支持配置边缘节点的系统日志和应用日志。 系统日志:
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
边缘节点有哪些故障场景? 边缘节点有如下故障场景: 容器引擎故障,包括容器引擎未启动和容器引擎服务异常 节点磁盘空间不足 边缘节点网络连接异常 GPU驱动异常 NPU插件异常 故障的处理方法请参考边缘节点故障如何处理?。 父主题: 边缘节点
String GPU memory大小,单位MB 表8 Nics 参数 参数类型 描述 interface String 边缘节点网卡名称 ip String 上述网卡对应的IPv4地址 表9 UpgradeHistory 参数 参数类型 描述 id Integer 节点升级或安装历史版本id
配置边缘节点环境 以具备sudo权限的用户登录边缘节点。 GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾 AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
配置边缘节点环境 以具备sudo权限的用户登录边缘节点。 GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
启动引起的系统异常。 安装GPU驱动并将GPU驱动文件拷贝到边缘节点指定目录下。 在园区人脸检测场景中,需要使用边缘节点上的GPU能力,所以需要提前在边缘节点上安装GPU驱动,缺少GPU驱动会导致人脸识别算法下发失败。 具体操作请参见拷贝GPU驱动文件。 购买DIS通道。 人脸检