搜索_华为云

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

对Qwen2-7B模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
demo.sh方式启动（历史版本） - AI开发平台ModelArts

进入代码目录/home/ma-user/ws/llm_train/AscendFactory/scripts_llamafactory下执行启动脚本，先修改以下命令中的参数，再复制执行。 # 单机执行命令为：sh demo.sh <MASTER_ADDR=localhost> <NNODES=1>

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
查询样本列表 - AI开发平台ModelArts

所属标注团队ID。表7 SampleLabel 参数参数类型描述 annotated_by String 视频标注途径，用于区分标签是人工标注的还是自动标注的。可选值如下： human：人工标注 auto：自动标注 id String 标签ID。 name String 标签名。 property

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量添加样本 - AI开发平台ModelArts

SampleLabel 参数是否必选参数类型描述 annotated_by 否 String 视频标注途径，用于区分标签是人工标注的还是自动标注的。可选值如下： human：人工标注 auto：自动标注 id 否 String 标签ID。 name 否 String 标签名。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看诊断报告 - AI开发平台ModelArts

p的计算耗时、通信耗时和空闲耗时。基于该表格，通常关注计算耗时(compute)和空闲耗时(free)这两列，可以初步分析当前瓶颈点是计算还是任务下发，以及是否存在计算快慢卡和下发快慢卡。如下图所示，可以看到8号卡的计算耗时明显大于其他卡，因此8号卡的“短板效应”将会拖慢集群的整

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

所属标注团队ID。表7 SampleLabel 参数参数类型描述 annotated_by String 视频标注途径，用于区分标签是人工标注的还是自动标注的。可选值如下： human：人工标注 auto：自动标注 id String 标签ID。 name String 标签名。 property

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

本方案介绍了在ModelArts的Server上使用昇腾计算资源开展CogVideoX1.5 5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
推理性能测试 - AI开发平台ModelArts

执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。执行性能测试脚本前，需先安装相关依赖。 conda activate python-3.9.10 pip install -r requirements.txt 静态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

ternvl_chat/internvl/model/internlm2/modeling_internlm2.py 步骤七：下载数据集先创建文件夹用来存放数据集，再下载数据集。 cd ${container_work_dir}/InternVL/internvl_chat

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

本方案介绍了在ModelArts Lite Server上使用昇腾计算资源部署ComfyUI、WebUI、Diffusers框架用于推理的详细过程。完成本方案的部署，需要先购买Server资源。本方案新增了300IDUO的支持。本方案目前仅适用于企业客户。资源规格要求推理部署推荐使用“西南-贵阳一”Re

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
推理性能测试 - AI开发平台ModelArts

执行静态、动态性能评测脚本 ├── requirements.txt # 第三方依赖目前性能测试已经支持投机推理能力。执行性能测试脚本前，需先安装相关依赖。 conda activate python-3.9.10 pip install -r requirements.txt 静态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

本方案介绍了在ModelArts的Server上使用昇腾计算资源开展MiniCPM-V 2.6 LoRA训练的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买Server资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region上的Server资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

方案概览本方案介绍了在ModelArts的DevServer上使用昇腾计算资源开展Wav2Lip训练的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
在MaaS中创建模型 - AI开发平台ModelArts

查看该版本的模型“任务记录”是否为空。是，表示模型未被用于训推任务，可以直接删除。则直接执行下一步。否，表示模型已被用于训推任务，需要先删除所有任务，再执行下一步。确认该模型的各个版本的“任务记录”都为空。当模型存在任务记录会删除失败。在模型详情页，单击右上角的“删除”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

http://127.0.0.1:8080/ 图11 预测在调试过程中，如果有修改模型文件或者推理脚本文件，需要重启run.sh脚本。执行如下命令先停止nginx服务，再运行run.sh脚本。 #查询nginx进程 ps -ef |grep nginx #关闭所有nginx相关进程 kill

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

ModelArts提供独享的计算资源，可用于Notebook、训练作业、部署模型。专属资源池不与其他用户共享，更加高效。在使用专属资源池之前，您需要先创建一个专属资源池，操作指导请参考创建Standard专属资源池。配置“网络”时需要选择已打通VPC的网络。如果需要新建网络和打通VPC可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

本方案介绍了在ModelArts的DevServer上使用昇腾计算资源开展MiniCPM-V2.0 LoRA训练的详细过程，及一份推理示例代码。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

对Qwen2-7B模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此处提供vLLM服务API接口启动和OpenAI服务API接口启动2种方式。详细启动

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

erties> 服务级别附加属性，便于服务管理。 load_balancer_policy 否 String 只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法)

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

本方案介绍了在ModelArts的DevServer上使用昇腾计算资源开展CogVideoX-2b/5b全量微调的详细过程。完成本方案的部署，需要先联系您所在企业的华为方技术支持购买DevServer资源。本方案目前仅适用于企业客户。资源规格要求推荐使用“西南-贵阳一”Region

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理

总条数： 337

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

demo.sh方式启动（历史版本） - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

分页查询团队标注任务下的样本列表 - AI开发平台ModelArts

CogVideoX1.5 5b模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.912） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

MiniCPM-V2.0推理及LoRA微调基于DevServer适配PyTorch NPU指导（6.3.910） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

CogVideoX模型基于DevServer适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线