搜索_华为云

推理精度测试 - AI开发平台ModelArts

gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数； quantization是量化参数，使用非量化权重，去掉quantization参数；如果使用awq、smoothquant或者gptq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
推理精度测试 - AI开发平台ModelArts

gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数； quantization是量化参数，使用非量化权重，去掉quantization参数；如果使用awq、smoothquant或者gptq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
推理精度测试 - AI开发平台ModelArts

gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数； quantization是量化参数，使用非量化权重，去掉quantization参数；如果使用awq、smoothquant或者gptq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
创建训练作业 - AI开发平台ModelArts

volumes属性列表参数是否必选参数类型说明 nfs 否 Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体说明请参见表6。 host_path 否 Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体说明请参见表7。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
资源选择推荐 - AI开发平台ModelArts

（建议不小于2U8G，本地存储空间100G，带EIP全动态BGP，按流量10M带宽） × 表2 开源数据集训练效率参考算法及数据资源规格 Epoch数运行时长（hh:mm:ss）算法：PyTorch官方针对ImageNet的样例数据：ImageNet分类数据子集 1机1卡Vnt1 10

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

ator参数说明”表下的说明查询修改 train_instance_count=1, # 节点数，适用于多机分布式训练，默认是1 #pool_id='若指定专属池，替换为页面上查到的poolI

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
查询数据集标签列表 - AI开发平台ModelArts

数据集版本ID。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100000]，默认为100000。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
分页查询智能任务列表 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。 offset 否 Integer 分页列表的起始页，默认为0。 task_name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建并管理工作空间 - AI开发平台ModelArts

推理服务GPU规格使用时长（单节点为统计基础单元）默认无限制，支持设置1~60000。分钟训练作业CPU规格训练核数默认无限制，支持设置1~10000。核训练作业GPU规格训练卡数默认无限制，支持设置1~1000。卡训练作业RAM规格训练内存大小默认无限制，支持设置1~100000。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
查询服务列表 - AI开发平台ModelArts

资源排队中，仅在线服务有这个状态。 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，默认为1000。 sort_by 否 String 指定排序字段，枚举值如下： publish_at: 服务发布时间，默认值 service_name:

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

04，建议不小于2U8G，本地存储空间100G，带EIP全动态BGP，按流量10M带宽） × 表2 开源数据集训练效率参考算法及数据资源规格 Epoch数预计运行时长（hh:mm:ss）算法：PyTorch官方针对ImageNet的样例数据：ImageNet分类数据子集 1机1卡Vnt1

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
约束与限制 - AI开发平台ModelArts

更多信息，请参见标签。功能限制表3 功能约束与限制功能使用限制 Standard专属资源池单次创建Standard专属资源池时，节点数建议不大于30，否则可能触发限流导致创建失败。更多信息，请参见创建专属资源池。只支持对状态为“运行中”的Standard专属资源池进行扩缩容，且不能缩容到0。

帮助中心 > AI开发平台ModelArts > 产品介绍
查询标注团队的成员列表 - AI开发平台ModelArts

String 标注团队ID。表2 Query参数参数是否必选参数类型描述 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,100]，默认为10。 offset 否 Integer 分页列表的起始页，默认为0。 order 否 String 指定排序顺序。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
启动智能任务 - AI开发平台ModelArts

inf_cluster_id 否 String 专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list 否 Array of InfConfig objects 运行推理任务需要的配置列表，可选填，默认为空。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
ModelArts最佳实践案例列表 - AI开发平台ModelArts

Wav2Lip训练基于DevServer适配PyTorch NPU训练指导 Wav2Lip，人脸说话视频模型，训练、推理 Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图像来输出与目标语音匹配的唇形同步视频，还可以直接将动态的视频进

 帮助中心 > AI开发平台ModelArts > 最佳实践
在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备模型文件和权重文件OBS路径下的文件传输至/home/mind/model路径下。 --tensor-parallel-size：并行卡数。此处举例为1，表示使用单卡启动服务。 --host：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理服务精度评测 - AI开发平台ModelArts

gpu_memory_utilization是gpu利用率，如果模型出现oom报错，调小参数； tensor_parallel_size是使用的卡数； quantization是量化参数，使用非量化权重，去掉quantization参数；如果使用awq、smoothquant或者gptq

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

总条数： 864

上一页
1
...
31
32
33
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

查询数据集标签列表 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

查询标注团队的成员列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线