检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。 下载GPU驱动,推荐驱动链接:
安装并配置GPU驱动 背景信息 对于使用GPU的边缘节点,在纳管边缘节点前,需要安装并配置GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至10.0版本对应的驱动。 操作步骤 安装GPU驱动。 下载GPU驱动,推荐驱动链接:
执行以下命令,编辑ntp.conf文件。 vim /etc/ntp.conf 添加以下语句,配置NTP服务器。 server NTP服务器域名 其中,NTP服务器域名请参考“华为云有没有提供NTP服务器,怎样安装?”获取。 示例: server ntp.myhuaweicloud.com 执行以下命令,系统重新启动时启动服务。
systemctl stop edgecore systemctl stop edgedaemon 更换显卡,重新安装显卡驱动,然后拷贝驱动文件,具体请参见安装并配置GPU驱动文件。 启动边缘agent服务。 systemctl start edgecore systemctl start
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
如果文件不存在,说明您没有安装NPU驱动,请前往安装NPU驱动。 6、GPU类型边缘节点未安装GPU驱动 如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至11.0版本对应的驱动。 安装GPU驱动。
GPU设备检查 功能 检查节点是否存在gpu设备,gpu驱动是否安装且运行正常。 语法 edgectl check gpu 参数说明 无 使用示例 检查节点GPU设备: edgectl check gpu 检查成功返回结果: +-----------------------+ |
请确认镜像的大小以及外网带宽,看是否会导致镜像下载超时。 例如:镜像大小为1G,而边缘节点的下载速度约200k/s。则下载时长约为:1024M/0.2M=5129S=85.3min。远超一个应用正常下发时长,因此应用无法下载成功。 针对这类问题,建议您首先将镜像下载至边缘节点后,再下发应用,省去下载步骤。 容器引擎异常
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
式。 通过证书注册。下载配置文件和边缘节点安装工具,在后续纳管边缘节点时将用到这些。 图3 下载配置文件和边缘核心软件 根据页面提示,单击“下载 边缘节点名称.tar.gz 配置文件”下载配置文件。 根据您边缘节点的CPU架构选择边缘节点安装工具,单击“下载EdgeCore Installer”。
114.114 节点无法连接DNS服务器。 在节点上,打开/etc/resolv.conf,获取当前配置的DNS服务器,对应ping该服务器的IP地址。 ping 114.114.114.114 DNS服务器不工作。 更换节点DNS服务器,或联系DNS服务器的维护人员进行修复。 父主题:
”。 通过证书注册。下载配置文件和边缘节点安装工具,在后续纳管边缘节点时将用到这些。 图3 下载配置文件和边缘核心软件 根据页面提示,单击“下载 边缘节点名称.tar.gz 配置文件”下载配置文件。 根据您边缘节点的CPU架构选择边缘节点安装工具,单击“下载EdgeCore Installer”。
配置边缘节点环境 以具备sudo权限的用户登录边缘节点。 GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾 AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
配置边缘节点环境 以具备sudo权限的用户登录边缘节点。 GPU驱动配置。 如果边缘节点使用GPU,您需要安装并配置GPU驱动,详细方法请参见安装并配置GPU驱动。 NPU驱动配置。 如果边缘节点使用昇腾AI加速处理器,请确保已安装对应驱动。 在边缘节点上安装Docker并检查Docker状态。
如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1.3.x.x和1.32.x.x的固件版本,例如1.3.2.B893,可用npu-smi info命令查看固件版本)(NPU驱动需不小于22.0.4版本,进入驱动所在路径如“/usr/local/Ascend/driver”,执行cat
边缘节点有哪些故障场景? 边缘节点有如下故障场景: 容器引擎故障,包括容器引擎未启动和容器引擎服务异常 节点磁盘空间不足 边缘节点网络连接异常 GPU驱动异常 NPU插件异常 故障的处理方法请参考边缘节点故障如何处理?。 父主题: 边缘节点
启动引起的系统异常。 安装GPU驱动并将GPU驱动文件拷贝到边缘节点指定目录下。 在园区人脸检测场景中,需要使用边缘节点上的GPU能力,所以需要提前在边缘节点上安装GPU驱动,缺少GPU驱动会导致人脸识别算法下发失败。 具体操作请参见拷贝GPU驱动文件。 购买DIS通道。 人脸检