检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
> 边缘节点”,单击页面右上角的“注册边缘节点”。 配置边缘节点基本信息。 如图1所示,填写边缘节点的名称,AI加速卡选择“Nvidia GPU”,不绑定终端设备。 图1 基本配置 如图2所示,为节点配置系统日志和应用日志。您可以自行选择是否开启云端日志(开启后,可在AOM服务中查看日志)。
硬盘 >= 1GB GPU(可选) 同一个边缘节点上的GPU型号必须相同。 说明: 当前支持Nvidia Tesla系列P4、P40、T4等型号GPU。 含有GPU硬件的机器,作为边缘节点的时候可以不使用GPU。 如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。 目前只有使用
Nvidia GPU:如果您的边缘节点搭载了Nvidia GPU显卡,请选择“Nvidia GPU”。 不启用:边缘节点未使用AI加速卡时选择。 如果边缘节点上没有搭载Nvidia GPU显卡,而这里选择了启用“Nvidia GPU”,则纳管边缘节点会失败。 如果边缘节点使用GPU,您需
和 memory Integer 边缘节点组内存总数,为边缘节点组所绑定的边缘节点的内存之和 gpu_num Integer 边缘节点组GPU总数,为边缘节点组所绑定的边缘节点的GPU数目之和 nodes Array of EdgeNodeResp objects 绑定的边缘节点详情
Nvidia GPU:如果您的边缘节点搭载了Nvidia GPU显卡,请选择“Nvidia GPU”。 不启用:边缘节点未使用AI加速卡时选择。 如果边缘节点上没有搭载Nvidia GPU显卡,而这里选择了启用“Nvidia GPU”,则纳管边缘节点会失败。 如果边缘节点使用GPU,您需
和 memory Integer 边缘节点组内存总数,为边缘节点组所绑定的边缘节点的内存之和 gpu_num Integer 边缘节点组GPU总数,为边缘节点组所绑定的边缘节点的GPU数目之和 nodes Array of EdgeNodeResp objects 绑定的边缘节点详情
和 memory Integer 边缘节点组内存总数,为边缘节点组所绑定的边缘节点的内存之和 gpu_num Integer 边缘节点组GPU总数,为边缘节点组所绑定的边缘节点的GPU数目之和 nodes Array of EdgeNodeResp objects 绑定的边缘节点详情
comment String 与device绑定关系描述(通过device id查询node时有值) gpu_info Array of GpuInfo objects gpu型号和gpu memory大小 device_num Integer 关联设备数量 enable_npu Boolean
和 memory Integer 边缘节点组内存总数,为边缘节点组所绑定的边缘节点的内存之和 gpu_num Integer 边缘节点组GPU总数,为边缘节点组所绑定的边缘节点的GPU数目之和 nodes Array of EdgeNodeResp objects 绑定的边缘节点详情
和 memory Integer 边缘节点组内存总数,为边缘节点组所绑定的边缘节点的内存之和 gpu_num Integer 边缘节点组GPU总数,为边缘节点组所绑定的边缘节点的GPU数目之和 nodes Array of EdgeNodeResp objects 绑定的边缘节点详情
comment String 与device绑定关系描述(通过device id查询node时有值) gpu_info Array of GpuInfo objects gpu型号和gpu memory大小 device_num Integer 关联设备数量 enable_npu Boolean
硬盘 >= 1GB GPU(可选) 同一个边缘节点上的GPU型号必须相同。 说明: 当前支持Nvidia Tesla系列P4、P40、T4等型号GPU。 含有GPU硬件的机器,作为边缘节点的时候可以不使用GPU。 如果边缘节点使用GPU,您需要在纳管前安装GPU驱动。 目前只有使用
comment String 与device绑定关系描述(通过device id查询node时有值) gpu_info Array of GpuInfo objects gpu型号和gpu memory大小 device_num Integer 关联设备数量 enable_npu Boolean
comment String 与device绑定关系描述(通过device id查询node时有值) gpu_info Array of GpuInfo objects gpu型号和gpu memory大小 device_num Integer 关联设备数量 enable_npu Boolean
Docker未运行 ERROR6103 Docker Cgroup Driver参数配置错误 ERROR6201 无GPU设备 ERROR6202 GPU驱动未安装 ERROR6203 GPU驱动未启动 ERROR6301 无NPU设备 数据采集错误 ERROR7001 故障数据收集失败 内部错误
images命令输出 GPU设备信息 收集ls /dev/nvidiactl /dev/nvidia-uvm /dev/nvidia? 2>&1命令输出 GPU内核模块信息 收集lsmod |grep -e nvidia -e nvidia-uvm 2>&1命令输出 GPU自身信息 收集
0时,升级至最新版本后业务容器无法启动问题 维护中 2.51.1 2021/04/20 【新增】更新GPU节点驱动安装方式,支持用户离线安装GPU驱动 【修复】2.51.0版本发现的D910问题 须知: GPU节点更新至此版本时,请参考拷贝GPU驱动文件进行环境准备。 维护中 2.51.0 2021/02/25 【修复】2
节点管理 边缘节点概述 配置边缘节点环境 注册边缘节点 纳管边缘节点 升级边缘节点 日志、监控和告警 安装并配置GPU驱动 边缘核心软件EdgeCore配置管理 删除边缘节点 父主题: 专业版操作指南
边缘应用 下发应用到边缘节点失败 容器应用在边缘节点启动失败 容器应用升级失败 容器镜像拉取失败 为什么看不到应用日志和系统日志? 应用GPU资源调度方式 如何控制容器引擎占用磁盘空间大小? 容器应用访问异常如何解决? 昇腾AI加速卡(NPU)应用异常如何解决?
在“故障”和“运行中”两者之间不断跳动。 GPU驱动异常 解决方法: 安装GPU驱动。 IEF当前支持Nvidia Tesla系列P4、P40、T4等型号GPU,支持CUDA Toolkit 8.0至11.0版本对应的驱动。 下载GPU驱动,推荐驱动链接: https://www