检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
约束限制 本文档适配昇腾云ModelArts 6.3.909版本,请参考获取软件和镜像获取配套版本的软件包和镜像,请严格遵照版本配套关系使用本文档。 训练至少需要单机8卡。 确保容器可以访问公网。
图4 推理成功 步骤三:WebUI部署 安装依赖和模型包 下载webui1.9.0版本软件包。
--use-v2-block-manager:vllm启动时使用V2版本的BlockSpaceManger来管理KVCache索引,如果不使用该功能,则无需配置。注意:如果使用投机推理功能,必须开启此参数。 --served-model-name:vllm服务后台id。
Postman推荐使用7.24.0版本。 打开Postman,如图2所示。 图2 Postman界面 在Postman界面填写参数,以图像分类举例说明。 选择POST任务,将在线服务的调用地址复制到POST后面的方框。
约束限制 本文档适配昇腾云ModelArts 6.3.910版本,请参考表2获取配套版本的软件包和镜像,请严格遵照版本配套关系使用本文档。 确保容器可以访问公网。
--use-v2-block-manager:vllm启动时使用V2版本的BlockSpaceManger来管理KVCache索引,如果不使用该功能,则无需配置。注意:如果使用投机推理功能,必须开启此参数。 --served-model-name:vllm服务后台id。
当导出数据集某一版本的数据时,需要指定该参数。 with_column_header 否 Boolean 导出时是否将列名写到CSV文件的第一行,对于表格数据集有效。
SWR共享版不支持细粒度权限项,因此需要配置Administrator权限。 训练作业状态变化通知。
目前默认开启此模式,若不开启,目前vllm0.6.0版本与实验室版本权重无法对齐,会导致小模型精度问题。
目前默认开启此模式,如果不开启,目前vllm0.6.0版本与实验室版本权重无法对齐,会导致小模型精度问题。
约束限制 本文档适配昇腾云ModelArts 6.3.907版本,请参考表2获取配套版本的软件包和镜像,请严格遵照版本配套关系使用本文档。 确保容器可以访问公网。
约束限制 本文档适配昇腾云ModelArts 6.3.909版本,请参考表2获取配套版本的软件包和镜像,请严格遵照版本配套关系使用本文档。 确保容器可以访问公网。
sdwebui 1.7.0版本软件包的官网下载地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui/tree/v1.7.0 docker cp stable-diffusion-webui sdwebui:/home/
目前默认开启此模式,若不开启,目前vllm0.6.0版本与实验室版本权重无法对齐,会导致小模型精度问题。
购买方案 ModelArts Standard场景下选择“ModelArts Standard(标准版)”。
目前默认开启此模式,若不开启,目前vllm0.6.0版本与实验室版本权重无法对齐,会导致小模型精度问题。
--use-v2-block-manager:vllm启动时使用V2版本的BlockSpaceManger来管理KVCache索引,如果不使用该功能,则无需配置。注意:如果使用投机推理功能,必须开启此参数。 --served-model-name:vllm服务后台id。
] } } } } } ] } 使用自定义依赖包的模型配置文件示例 如下示例中,定义了1.16.4版本的
ModelArts当前仅支持CANN商用版本,不支持社区版。 下载Miniconda3安装文件。
pytorch_2_1_ascend:pytorch_2.1.0-cann_8.0.rc2-py_3.9-hce_2.0.2312-aarch64-snt9b-20240528150158-b521cc0 SWR上拉取 约束限制 本文档适配昇腾云ModelArts 6.3.905版本