搜索_华为云

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

zip软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912版本。说明：如果上述软件获取路径打开后未显示相应的软件信

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ion的block大小，推荐设置为128。 --host=${docker_ip}：服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

识别出此图片的数字是“2”。本案例中使用的MNIST是比较简单的用做demo的数据集，配套算法也是比较简单的用于教学的神经网络算法。这样的数据和算法生成的模型仅适用于教学模式，并不能应对复杂的预测场景。即生成的模型对预测图片有一定范围和要求，预测图片必须和训练集中的图片相似（黑底白字）才可能预测准确。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable 否 Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 terminat

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”，在测试页面根据任务类型以及页面提示完成对应的测试。调用API 待推理服务的状态变为“运行中”时，可单击操作列的“调用”，复制对应的接口代码，在本地环境或云端的开发环境中进行接口。图1 调用接口当部署推理服务的“安全认证”选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
自定义脚本代码示例 - AI开发平台ModelArts

从OBS中导入模型文件创建模型时，模型文件包需符合ModelArts的模型包规范，推理代码和配置文件也需遵循ModelArts的要求。本章节提供针对常用AI引擎的自定义脚本代码示例（包含推理代码示例）。模型推理代码编写的通用方法及说明请见模型推理代码编写说明。 Tensorflow

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
创建数据集 - AI开发平台ModelArts

表2 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。 work_path 是表6 数据集输出位置，用于存放输出的标注信息等文件。 labels 否 List

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。图4 获取登录指令此处生成的登录指令有效期为24小时，如果需要长期有效的登录指令，请参见获取长期有效登录指令。获取了长期有效的登录指令后，在有效期内的临时登录指令仍然可以使用。登录指令末尾的域名为镜像仓库地址，请记录该地址，后面会使用到。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
查询开发环境实例详情 - AI开发平台ModelArts

存储路径。如果type为“obs”类型，该值必须填写，该值需为有效的OBS桶路径，且以“/”结束。不能指定为OBS桶的根目录，需指定为OBS桶下的具体目录。如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
更新开发环境实例信息 - AI开发平台ModelArts

存储路径。如果type为“obs”类型，该值必须填写，该值需为有效的OBS桶路径，且以“/”结束。不能指定为OBS桶的根目录，需指定为OBS桶下的具体目录。如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
准备推理环境 - AI开发平台ModelArts

将权重文件上传到Server机器中。权重文件的格式要求为Huggingface格式。开源权重文件获取地址请参见支持的模型列表。如果使用模型训练后的权重文件进行推理，模型训练及训练后的权重文件转换操作可以参考大模型训练相关文档。权重要求放在磁盘的指定目录，并做目录大小检查，参考命令如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

_eval.sh中的参数模型存放的地方，如果根据第2步的方式保存的模型，设置如下： CKPT="llama-vid/llama-vid-7b-full-224-video-fps-1" 调用openai的key，评估精度时需要调用openai，需要填写正确的key，这个可能需要进行付费调用，评估1000条大概需要0

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询团队标注任务详情 - AI开发平台ModelArts

允许发起新的验收任务，只能继续完成当前验收任务。 3：通过。团队标注任务已完成。 4：驳回。manager再次启动任务，重新修改标注和审核工作。 5：验收结果同步中。验收任务改为异步，新增验收结果同步中的状态，此时不允许发起新的验收任务，也不允许继续当前验收，任务名称的地方提示用户同步中。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

911软件包中的AscendCloud-CV-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，登录后在此路径中查找下载ModelArts 6.3.911 版本。说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

一个预训练的文本到图像模型CogView2，还提出了多帧速率分层训练策略，以更好地对齐文本和视频剪辑。作为一个开源的大规模预训练文本到视频模型，CogVideo性能优于所有公开可用的模型，在机器和人类评估方面都有很大的优势。方案概览本方案介绍了在ModelArts的Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
部署在线服务 - AI开发平台ModelArts

权重百分比，分配到此模型的流量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 {

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.5.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
约束与限制 - AI开发平台ModelArts

过资源池的容器引擎空间大小的一半。镜像过大会直接影响训练作业的启动时间。ModelArts公共资源池的容器引擎空间为50G，专属资源池的容器引擎空间的默认为50G，支持在创建专属资源池时自定义容器引擎空间。用于训练的自定义镜像的默认用户必须为“uid”为“1000”的用户。 Standard推理的创建模型

 帮助中心 > AI开发平台ModelArts > 产品介绍
删除资源池 - AI开发平台ModelArts

Integer 资源规格的弹性使用量，物理池该值和count相同。 azs Array of azs objects 资源所在的AZ的数量。 nodePool String 节点池名称。比如：nodePool-1。表15 azs 参数参数类型描述 az String AZ的名称。 count

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理

总条数： 1554

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

更新开发环境实例信息 - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

LLaMA-VID基于Lite Server适配PyTorch NPU推理指导（6.3.910） - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

CogVideoX模型基于Lite Server适配PyTorch NPU全量训练指导（6.3.911） - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线