AI开发平台MODELARTS-准备推理环境:步骤六:进入容器

时间:2025-03-12 09:40:19

步骤六:进入容器

  1. 进入容器。
    docker exec -it -u ma-user ${container_name} /bin/bash
  2. 评估推理资源。运行如下命令,返回NPU设备信息可用的卡数。
    npu-smi info       # 启动推理服务之前检查卡是否被占用、端口是否被占用,是否有对应运行的进程

    如出现错误,可能是机器上的NPU设备没有正常安装,或者NPU镜像被其他容器挂载。请先正常安装固件和驱动,或释放被挂载的NPU。

    驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。启动后容器默认端口是8080。

  3. 配置需要使用的NPU卡为容器中的第几张卡。例如:实际使用的是容器中第1张卡,此处填写“0”。
    export ASCEND_RT_VISIBLE_DEVI CES =0

    如果启动服务需要使用多张卡,则按容器中的卡号依次编排。例如:实际使用的是容器中第1张和第2张卡,此处填写为“0,1”,以此类推。

    export ASCEND_RT_VISIBLE_DEVICES=0,1
    可以通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡,如果希望使用第一和第二张卡,则“export ASCEND_RT_VISIBLE_DEVICES=0,1”,注意编号不是填4、5。
    图1 查询结果

    启动推理服务的具体操作步骤请参见启动推理服务

support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_infer_5901005.html