搜索_华为云

训练作业运行失败排查指导 - AI开发平台ModelArts

原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。查看训练作业的“日志”，出现报错“ERROR:root:label_map.pbtxt cannot

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
注册自定义镜像 - AI开发平台ModelArts

ASCEND service_type 否 String 镜像支持服务类型。枚举值如下： COMMON：通用镜像。 INFERENCE: 建议仅在推理部署场景使用。 TRAIN: 建议仅在训练任务场景使用。 DEV: 建议仅在开发调测场景使用。 UNKNOWN: 未明确设置的镜像支持的服务类型。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练声音分类模型 - AI开发平台ModelArts

本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现声音分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
查询模型列表 - AI开发平台ModelArts

UTC'的毫秒数。 description String 模型描述信息。 source_type String 模型来源的类型，仅当模型为自动学习部署过来时有值，取值为“auto”。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
训练文本分类模型 - AI开发平台ModelArts

本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现文本分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现文本分类
训练图像分类模型 - AI开发平台ModelArts

本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。父主题：使用自动学习实现图像分类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
Lite功能介绍 - AI开发平台ModelArts

ModelArts Lite Server提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装加速卡相关的驱动和其他软件，使用SFS或OBS进行数据存储和读取相关的操作，满足算法工程师进行日常训练的需要。 ModelArts Lite

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
什么是区域、可用区？ - AI开发平台ModelArts

情。如何选择可用区？是否将资源放在同一可用区内，主要取决于您对容灾能力和网络时延的要求。如果您的应用需要较高的容灾能力，建议您将资源部署在同一区域的不同可用区内。如果您的应用要求实例之间的网络延时较低，则建议您将资源创建在同一可用区内。区域和终端节点当您通过API使用

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
创建训练作业版本 - AI开发平台ModelArts

训练作业的版本名称。请求示例如下以创建“job_id”为10，“pre_version_id”为20的一个新版本作业为例。 POST https://endpoint/v1/{project_id}/training-jobs/10/versions/ { "job_desc":

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询数据处理任务的版本列表 - AI开发平台ModelArts

String 数据集的版本名称，名称仅包含数字、字母、中划线和下划线，长度是0-32位。请求示例查询数据处理任务版本列表 GET https://{endpoint}/v2/{project_id}/processor-tasks/{task_id}/versions?offset=0&limit=5

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
ModelArts支持云审计的关键操作 - AI开发平台ModelArts

dataset createAutoLabelingTask 创建自动分组任务 dataset createAutoGroupingTask 创建自动部署任务 dataset createAutoDeployTask 导入样本到数据集 dataset importSamplesToDataset

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
查询单个样本信息 - AI开发平台ModelArts

200,3]和[100,200]均合法。说明：只有当样本的标签列表包含物体检测标签时，此字段必选。请求示例查询单个样本信息 GET https://{endpoint}/v2/{project_id}/datasets/{dataset_id}/data-annotations

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

deepseek-v2-236B deepseek-coder-v2-lite-16B Ascend-vllm支持如下推理特性：支持分离部署支持多机推理支持大小模型投机推理及eagle投机推理支持chunked prefill特性支持automatic prefix caching

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理性能测试 - AI开发平台ModelArts

已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-3rdLLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，执行如下命令安装性能测试的关依赖。 pip install -r requirements

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理性能测试 - AI开发平台ModelArts

已经上传benchmark验证脚本到推理容器中。如果在Step5 进入容器安装推理依赖软件步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一个conda环境，执行如下命令安装性能测试的关依赖。 conda activate

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendCloud-6.3.907-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的模型训练代码、推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
准备MaaS资源 - AI开发平台ModelArts

OBS桶必须和MaaS服务在同一个Region下，否则无法选择到该OBS路径。准备资源池在ModelArts Studio大模型即服务平台进行模型调优、压缩或部署时，需要选择资源池。MaaS服务支持专属资源池和公共资源池。专属资源池：专属资源池不与其他用户共享，资源更可控。在使用专属资源池之前，您

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

sh # 系列模型共同调用的多功能的脚本 |── install.sh # 环境部署脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作

总条数： 1401

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业运行失败排查指导 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

查询模型列表 - AI开发平台ModelArts

训练文本分类模型 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

Lite功能介绍 - AI开发平台ModelArts

什么是区域、可用区？ - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

查询数据处理任务的版本列表 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

ModelArts支持云审计的关键操作 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾云服务6.3.909版本说明 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备MaaS资源 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线