搜索_华为云

查询服务详情 - AI开发平台ModelArts

例只能调度到指定节点，指定节点不存在则失败。preferred表示弱亲和，服务实例倾向于调度到指定节点，指定节点不满足调度条件，则会调度到其他节点。 pool_infos Array of AffinityPoolInfo objects 配置亲和策略到指定的集群，并指定集群的节点。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

ADD run.sh /home/mind/ CMD /bin/bash /home/mind/run.sh 完成镜像构建后，将镜像注册至华为云容器镜像服务SWR中，用于后续在ModelArts上部署推理服务。使用适配后的镜像在ModelArts部署在线推理服务。在obs中创

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建ModelArts数据集 - AI开发平台ModelArts

自由格式：管理的数据可以为任意格式，目前不支持标注，适用于无需标注或开发者自行定义标注的场景。如果您的数据集需存在多种格式数据，或者您的数据格式不符合其他类型数据集时，可选择自由格式的数据集。表格表格：适合表格等结构化数据处理。数据格式支持csv。不支持标注，支持对部分表格数据进行预览，但是最多支持100条数据预览。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

USE_PFA_HIGH_PRECISION_MODE=1 # PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
终止训练作业 - AI开发平台ModelArts

flavor_info flavor_info object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表35 billing 参数参数类型描述 code String 计费码。 unit_num Integer 计费卡数。表36

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
部署推理服务 - AI开发平台ModelArts

grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。 docker -v #检查docker是否安装

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
创建开发环境实例 - AI开发平台ModelArts

殊字符&<>"'/，缺省值为空。 flavor 是 String 实例的机器规格。实际支持规格以具体区域为准。如果您需要使用默认规格之外的其他规格，请提交工单修改规格。 spec 是 Object 实例定义，当前仅支持Notebook，如表3所示。 workspace 否 Object

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询训练作业详情 - AI开发平台ModelArts

flavor_info flavor_info object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表35 billing 参数参数类型描述 code String 计费码。 unit_num Integer 计费卡数。表36

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询训练作业列表 - AI开发平台ModelArts

flavor_info flavor_info object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表37 billing 参数参数类型描述 code String 计费码。 unit_num Integer 计费卡数。表38

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
模型配置文件编写说明 - AI开发平台ModelArts

7。runtime可选值与model_type相关，当model_type设置为Image时，不需要设置runtime，当model_type设置为其他常用框架时，请选择您使用的引擎所对应的运行时环境。目前支持的运行时环境列表请参见推理支持的AI引擎。需要注意的是，如果您的模型需指定CP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

# PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。如果需要增加模型量化功能，启动推理服务前，先参考推理模型量化章节对模型做量化处理。启动服务与请求。此

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
准备镜像环境 - AI开发平台ModelArts

grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v # 检查containerd是否安装

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
部署推理服务 - AI开发平台ModelArts

# PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

# PFA算子是否使用高精度模式；默认值为0表示不开启。针对Qwen2-7B模型和Qwen2-57b模型，必须开启此配置，否则精度会异常；其他模型不建议开启，因为性能会有损失。若要开启图模式，请配置以下4个环境变量，并且启动服务时不要添加enforce-eager参数。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
准备镜像环境 - AI开发平台ModelArts

grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v # 检查containerd是否安装

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

devel开发包)中。它提供了一组C函数，用于读取、修改和创建ELF文件，而NVIDIA驱动程序需要使用这些函数来解析当前正在运行的内核和其他相关信息。安装过程中的提示均选OK或YES，安装好后执行reboot重启机器，再次登录后执行命令查看GPU卡信息。 nvidia-smi

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

建议容器分层构建，单层容量不要超过1G、文件数不大于10w个。分层时，先构建不常变化的层，例如：先OS，再cuda驱动，再Python，再pytorch，再其他依赖包。如果训练数据和代码经常变动，则不建议把数据、代码放到容器镜像里，避免频繁地构建容器镜像。容器已经能满足隔离需求，不建议在容器内再创建多个conda

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
终止训练作业 - AI开发平台ModelArts

flavor_info FlavorInfoResponse object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表34 FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业列表 - AI开发平台ModelArts

flavor_info FlavorInfoResponse object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表36 FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

flavor_info FlavorInfoResponse object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表33 FlavorInfoResponse 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 1048

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询服务详情 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

创建ModelArts数据集 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练任务 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线