检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
network:检查节点是否能与IEF连接 docker:检查docker是否正常运行 gpu或nvidia:检查gpu设备是否存在且驱动正常运行 npu:检查npu设备是否存在 CHECKITEMS以英文的逗号“,”分隔,如下所示: edgectl diag install [params] cpu
修订记录 日期 修订记录 2023-08-03 修改npu_type参数内容。 2022-11-22 第九次正式发布。 新增 边缘节点组管理接口。 服务管理接口。 加密数据管理接口。 批量节点管理接口。 批量作业管理接口。 2022-11-02 第八次正式发布。 新增系统订阅管理相关接口。
目前只有使用x86架构的GPU节点才能纳管到IEF中使用。 NPU(可选) 昇腾AI加速处理器。 说明: 当前支持集成了昇腾处理器的边缘节点,如Atlas 300推理卡、Atlas 800推理服务器。同时支持昇腾310、昇腾310B。 如果边缘节点使用NPU,请确保边缘节点已安装驱动(目前昇腾310仅支持1
object 工作负载存活探针 readiness_probe ProbeDetail object 工作负载业务探针 npu_type String NPU类型,支持D310、D310B,支持填写: D310:D310类型 D310B:D310B类型 不填表示为D310类型。 表6
一致,否则会创建应用失败,详见注册边缘节点。 虚拟化切分后的NPU类型,一个容器只能挂载一个虚拟化NPU,只有当该容器退出后,该虚拟化NPU才能分配给其他容器使用。 昇腾AI加速卡支持的NPU类型,如下表。 表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B
"installer_version":"1.0.6","os":"euleros"} 5、AI加速卡类型的边缘节点未安装NPU驱动 如果您在注册边缘节点时选了AI加速卡类型的边缘节点,边缘节点必须支持NPU,并且确保您安装了NPU驱动。 在您的边缘节点执行以下命令: ls /dev/davinci_manager /dev/hisi_hdc
应用失败,详见注册边缘节点时AI加速卡配置。 虚拟化切分后的NPU类型,一个容器只能挂载一个虚拟化NPU,只有当该容器退出后,该虚拟化NPU才能分配给其他容器使用。 昇腾AI加速卡支持的NPU类型,如下表。 表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B
x86_64 执行以下命令修改目录权限。 chmod -R 755 /var/IEF NPU插件异常 登录边缘节点。 执行如下命令查看NPU驱动容器是否工作正常。 docker ps -a |grep npu 如果容器状态不是running,则重启容器。 docker restart {container_name}
object 工作负载存活探针 readiness_probe ProbeDetail object 工作负载业务探针 npu_type String NPU类型,支持D310、D310B,支持填写: D310:D310类型 D310B:D310B类型 不填表示为D310类型。 表8
object 工作负载存活探针 readiness_probe ProbeDetail object 工作负载业务探针 npu_type String NPU类型,支持D310、D310B,支持填写: D310:D310类型 D310B:D310B类型 不填表示为D310类型。 表9
应用失败,详见注册边缘节点时AI加速卡配置。 虚拟化切分后的NPU类型,一个容器只能挂载一个虚拟化NPU,只有当该容器退出后,该虚拟化NPU才能分配给其他容器使用。 昇腾AI加速卡支持的NPU类型,如下表。 表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B
须一致,否则会创建应用失败,详见注册边缘节点。 虚拟化切分后的NPU类型,一个容器只能挂载一个虚拟化NPU,只有当该容器退出后,该虚拟化NPU才能分配给其他容器使用。 AI加速卡支持的NPU类型,如下表。 表1 NPU类型说明 类型 描述 昇腾310 昇腾310芯片 昇腾310B
Driver参数配置错误 ERROR6201 无GPU设备 ERROR6202 GPU驱动未安装 ERROR6203 GPU驱动未启动 ERROR6301 无NPU设备 数据采集错误 ERROR7001 故障数据收集失败 内部错误 ERROR8001 意外错误 父主题: 错误码
边缘核心软件EdgeCore配置管理 操作场景 IEF边缘软件支持对EdgeCore配置参数进行管理,通过该功能您可以对边缘核心软件EdgeCore进行深度配置。 操作步骤 在边缘节点上执行如下命令修改EdgeCore配置,并保存。 vi /opt/IEF/Edge-core/conf/edge
边缘核心软件EdgeCore配置管理 操作场景 IEF边缘软件支持对EdgeCore配置参数进行管理,通过该功能您可以对边缘核心软件EdgeCore进行深度配置。 操作步骤 在边缘节点上执行如下命令修改EdgeCore配置,并保存。 vi /opt/IEF/Edge-core/conf/edge
处于维护周期外的版本升级,可能会因为容器重启引起业务的短暂中断。 请勿在节点升级过程中变更节点配置,比如重启Docker、安装卸载GPU/NPU驱动、OS内核升级、变更网络配置等,这些操作会增大节点升级失败风险。 操作步骤 登录IEF管理控制台。 选择左侧导航栏的“批量管理 > 节
处于维护周期外的版本升级,可能会因为容器重启引起业务的短暂中断。 请勿在节点升级过程中变更节点配置,比如重启Docker、安装卸载GPU/NPU驱动、OS内核升级、变更网络配置等,这些操作会增大节点升级失败风险。 操作步骤 登录IEF管理控制台,在“总览”页面切换实例为铂金版。 选择左侧导航栏的“批量管理
处于维护周期外的版本升级,可能会因为容器重启引起业务的短暂中断。 请勿在节点升级过程中变更节点配置,比如重启Docker、安装卸载GPU/NPU驱动、OS内核升级、变更网络配置等,这些操作会增大节点升级失败风险。 操作步骤 登录边缘节点,配置防火墙规则。 检查边缘节点防火墙状态。 systemctl
处于维护周期外的版本升级,可能会因为容器重启引起业务的短暂中断。 请勿在节点升级过程中变更节点配置,比如重启Docker、安装卸载GPU/NPU驱动、OS内核升级、变更网络配置等,这些操作会增大节点升级失败风险。 操作步骤 登录边缘节点,配置防火墙规则。 检查边缘节点防火墙状态。 systemctl
smi 2>&1命令输出 GPU驱动状态信息 收集systemctl status nvidia-drivers-loader命令输出 NPU设备信息 收集ls /dev/davinci_manager /dev/hisi_hdc /dev/davinci?命令输出 语法 edgectl