搜索_华为云

AI Gallery（新版） - AI开发平台ModelArts

AI Gallery（新版） AI Gallery使用流程发布和管理AI Gallery模型发布和管理AI Gallery数据集发布和管理AI Gallery项目发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
自定义模型规范 - AI开发平台ModelArts

自定义模型使用的预置镜像 AI Gallery提供了PyTorch基础镜像，镜像里已经安装好了运行任务所需的软件，供自定义模型直接使用，快速进行训练、推理。预置镜像的版本信息请参见表3。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
推理场景介绍 - AI开发平台ModelArts

镜像版本本教程中用到基础镜像地址和配套版本关系如下表所示，请提前了解。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
托管模型到AI Gallery - AI开发平台ModelArts

当托管的是自定义镜像时，上传的模型文件要满足自定义镜像规范，否则该镜像无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。当文件状态变成“上传成功”表示数据文件成功上传至AI Gallery仓库进行托管。单击“完成”返回模型文件页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
下线公告 - AI开发平台ModelArts
下线公告 - AI开发平台ModelArts

下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告【下线公告】华为云ModelArts服务旧版数据集下线公告【下线公告】华为云ModelArts服务模型转换下线公告【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告

 帮助中心 > AI开发平台ModelArts > 服务公告
服务预测 - AI开发平台ModelArts
服务预测 - AI开发平台ModelArts

服务预测失败，报错APIG.XXXX 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4503 在线服务预测报错MR.0105 Method Not Allowed 请求超时返回Timeout 自定义镜像导入模型部署上线调用

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署
ModelArts CLI命令参考 - AI开发平台ModelArts

ModelArts CLI命令参考 ModelArts CLI命令功能介绍（可选）本地安装ma-cli ma-cli auto-completion自动补全命令 ma-cli configure鉴权命令 ma-cli image镜像构建支持的命令 ma-cli ma-job训练作业支持的命令

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
创建DevServer - AI开发平台ModelArts

表11 ServerImageResponse 参数参数类型描述 arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

表8 ServerImageResponse 参数参数类型描述 arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
查询用户所有DevServer实例列表 - AI开发平台ModelArts

表8 ServerImageResponse 参数参数类型描述 arch String 服务器镜像架构类型。 ARM X86 image_id String 服务器镜像ID。 name String 服务器镜像名称。 server_type String 服务器类型。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
创建训练作业版本 - AI开发平台ModelArts

user_command 否 String 自定义镜像训练作业的自定义镜像的容器的启动命令。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
预置算法运行故障 - AI开发平台ModelArts

directory” 日志提示“UnboundLocalError: local variable 'epoch'” 使用订阅算法训练结束后没有显示模型评估结果创建训练任务并成功运行, 但是发布到至AI Gallery时, 版本那块显示状态异常使用python3.6-torch1.4版本镜像环境安装

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
查询训练作业参数详情 - AI开发平台ModelArts

user_image_url String 自定义镜像训练作业的自定义镜像的SWR-URL。 user_command String 自定义镜像训练作业的自定义镜像的容器的启动命令。 spec_code String 训练作业资源规格。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

表4 image_info 参数参数类型描述 cpu_image_url String cpu规格下对应镜像。 gpu_image_url String gpu或者Ascend规格下对应镜像。 image_version String 镜像版本。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备镜像准备训练模型适用的容器镜像。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调、超参配置、训练任务、性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

训练作业中存在2个代码目录，一个是从OBS上传到ModelArts Standard训练容器中的代码目录OBS_CODE_DIR，一个是后续构建新镜像步骤ECS中构建新镜像中镜像的代码目录CODE_DIR。修改代码如图1。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
训练作业运行失败排查指导 - AI开发平台ModelArts

原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
查看在线服务的事件 - AI开发平台ModelArts

正常开始构建镜像。 Start to build image. - 异常构建模型(xxx) 镜像失败，构建日志:\nxxx。 Failed to build image for model (%s %s), docker build log:\n%s.

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询模型runtime - AI开发平台ModelArts

目前共两种： base_image (基础镜像) uniform_image (统一镜像) 表6 Accelerator 参数参数类型描述 type String 加速卡类型，目前共三种： npu gpu none name String 加速卡名称，如SNT9B。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理

总条数： 715

上一页
1
...
26
27
28
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI Gallery（新版） - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

下线公告 - AI开发平台ModelArts

服务预测 - AI开发平台ModelArts

ModelArts CLI命令参考 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

实时同步用户所有DevServer实例状态 - AI开发平台ModelArts

查询用户所有DevServer实例列表 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

预置算法运行故障 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线