AI开发平台MODELARTS-非分离部署推理服务:Step4 制作推理镜像

时间:2024-12-09 20:36:21

Step4 制作推理镜像

解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6.3.908-xxx.zip和算子包AscendCloud-OPP-6.3.908-xxx.zip。
unzip AscendCloud-*.zip -d ./AscendCloud && unzip ./AscendCloud/AscendCloud-OPP-*.zip -d ./AscendCloud/AscendCloud-OPP && unzip ./AscendCloud/AscendCloud-LLM-*.zip -d ./AscendCloud/AscendCloud-LLM && cd ./AscendCloud/AscendCloud-LLM/llm_inference/ascend_vllm/

修改build.sh,增加如下命令:

pip install outlines==0.0.46
图1 修改build.sh

执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git clone,请确保机器环境可以访问公网。

sh build_image.sh --base-image=${base_image} --image-name=${image_name}

参数说明:

  • ${base_image}为基础镜像地址。
  • ${image_name}为推理镜像名称,可自行指定。

运行完后,会生成推理所需镜像。

support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_infer_90803.html