搜索_华为云

使用AWQ量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

以上代码中的"<modelarts_action>"、"<your_ssf_id>"、"<sfs_path>"、"<sfs_option>"，需要根据您的业务需求替换为实际的参数，各参数含义如下。表1 参数解释参数参数解释 Action 表示在何种场景下授予SFS Turbo文件夹访问权限。创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

0.2.2和Diffusers 0.30.2框架的推理过程。另外，FLUX.1-schnell模型的使用方法和FLUX.1-dev一致，只需替换权重文件即可，本文以FLUX.1-schn为例。约束限制本方案目前仅适用于企业客户。本文档适配昇腾云ModelArts 6.3.91

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
准备镜像环境 - AI开发平台ModelArts

由于使用的容器引擎是containerd，不再是docker，因此需要改写复制的登录指令，将docker进行替换，使用nerdctl工具。 # docker login 替换为： nerdctl login 步骤五修改并上传镜像 1. 在机器中输入Step4登录指令后，使用下列示例命令将镜像上传至SWR：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备镜像环境 - AI开发平台ModelArts

由于使用的容器引擎是containerd，不再是docker，因此需要改写复制的登录指令，将docker进行替换，使用nerdctl工具。 # docker login 替换为： nerdctl login 步骤五修改并上传镜像 1. 在机器中输入Step4登录指令后，使用下列示例命令将镜像上传至SWR：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

由于使用的容器引擎是containerd，不再是docker，因此需要改写复制的登录指令，将docker进行替换，使用nerdctl工具。 # docker login 替换为： nerdctl login 步骤五修改并上传镜像 1. 在机器中输入Step4登录指令后，使用下列示例命令将镜像上传至SWR：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
使用PyCharm手动连接Notebook - AI开发平台ModelArts

ch-1.0.0/bin/python 如果路径为~/anaconda3/envs/Pytorch-1.0.0/bin/python，把~替换为/home/ma-user即可。 Sync folders: 需要配置本地的工程目录文件同步到云上开发环境中的某个目录，推荐配置为/ho

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
使用AWQ量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：执行时间预计10分钟。执行完成后会将权重路径下的原始权重替换成转换后的权重。如需保留之前权重格式，请在转换前备份。 python convert_awq_to_npu.py --model /home/ma-user/Qwen1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
准备镜像环境 - AI开发平台ModelArts

由于使用的容器引擎是containerd，不再是docker，因此需要改写复制的登录指令，将docker进行替换，使用nerdctl工具。 # docker login 替换为： nerdctl login 步骤五修改并上传镜像 1. 在机器中输入Step4登录指令后，使用下列示例命令将镜像上传至SWR：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

-steps个token。开启投机推理后无需配置该参数。 --host=${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

上传镜像至容器镜像服务镜像仓库。使用docker tag命令给上传镜像打标签。 #region和domain信息请替换为实际值，组织名称deep-learning也请替换为自定义的值。 sudo docker tag mindspore:2.1.1-cann6.3.RC2 swr.{region}

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询服务更新日志 - AI开发平台ModelArts

目录下，如“/”、“/var/run”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。 storage_type String 挂载类型sfs_turbo极速文件系统挂载。 source_address

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

_name}:${image_version}请替换为您所要上传的实际镜像的名称和版本名称。 [镜像仓库地址]：可在SWR控制台上查询，即1.c中登录指令末尾的域名。 [组织名称]：/${organization_name}请替换为您创建的组织。 [镜像名称2:版本名称2]：${

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
推理服务精度评测 - AI开发平台ModelArts

lm-eval，参考命令如下。参数quantization="smoothquant"表示smoothquant量化，可以根据实际量化场景替换为awq等。 lm_eval --model vllm --model_args pretrained="/data/nfs/benc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
分离部署推理服务 - AI开发平台ModelArts

并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用,（英文逗号）分隔开作为该环境变量的输入。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

er目录下。获取路径参见表2。解压AscendCloud-AIGC-*.zip文件，解压后将里面指定文件与对应MiniCPM-V文件进行替换。 cd /home/ma-user unzip AscendCloud-AIGC-*.zip -d ./AscendCloud cd

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
分离部署推理服务 - AI开发平台ModelArts

并按照global rank_table中的全量实例、增量实例的顺序，对全量推理实例、增量推理实例启动的端口号进行排序，端口之间用,（英文逗号）分隔开作为该环境变量的输入。 USE_OPENAI：仅在服务入口实例生效，用于配置api-server服务是否使用openai服务，默认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
SD3基于DevServer适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

--device=/dev/davinci1 \ --network=bridge \ ${image_name} bash 进入容器。需要将${container_name}替换为实际的容器名称。 docker exec -it ${container_name} bash 步骤二：上传代码、权重和数据集到容器中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
功能总览 - AI开发平台ModelArts
功能总览 - AI开发平台ModelArts

其中Ascend Snt9系列可为用户解决图像分类和物体检测两大类模型训练场景；Ascend Snt3系列可应用于图像分类、物体检测、图像分割、NLP等常用深度学习领域高性能推理场景。同时，使用MindSpore开发的模型可直接在ModelArts平台完成训练和推理。发布区域：华北-北京四、西南-贵阳一

 帮助中心 > AI开发平台ModelArts > 功能总览

总条数： 336

上一页
1
...
10
11
12
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化 - AI开发平台ModelArts

给子账号配置文件夹级的SFS Turbo访问权限 - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

SD3基于DevServer适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

功能总览 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线