搜索_华为云

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

ModelArts推理服务的端到端运维覆盖了算法开发、服务运维和业务运行的整个AI流程。方案概述推理服务的端到端运维流程算法开发阶段，先将业务AI数据存放到对象存储服务（OBS）中，接着通过ModelArts数据管理进行标注和版本管理，然后通过训练获得AI模型结果，最后通过开发环境构建模型镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询可视化作业列表 - AI开发平台ModelArts

指定作业所处的工作空间，默认值为“0”。请求消息无请求参数。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 error_message

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

ModelArts会挂载硬盘至“/cache”目录，用户可以使用此目录来储存临时文件。“/cache”与代码目录共用资源，不同资源规格有不同的容量。 k8s磁盘的驱逐策略是90%，所以可以正常使用的磁盘大小应该是“cache目录容量 x 0.9”。裸机的本地磁盘为物理磁盘，无法扩容，如果存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

环境准备迁移环境简介 ModelArts开发环境针对推理昇腾迁移的场景提供了云上可以直接访问的开发环境，具有如下优点：利用云服务的资源使用便利性，可以直接使用到不同规格的昇腾设备。通过指定对应的运行镜像，可以直接使用预置的、在迁移过程中所需的工具集，且已经适配到最新的版本可以直接使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
更新可视化作业描述 - AI开发平台ModelArts

"This is a ModelArts job" } 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Illegal name: %%123"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
重启可视化作业 - AI开发平台ModelArts

ualization-jobs/10/restart 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "This job can't be resubmit

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
更新训练作业描述 - AI开发平台ModelArts

Estimator请求参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参考Session鉴权。 job_id 是 String 训练作业的id，可通过创建训练作业生成的训练作业对象查询，如"job_instance.job_id"，或从查询训练作业列表的响应中获得。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
查询训练作业列表 - AI开发平台ModelArts

npu_proc_restart: NPU原地热恢复 gpu_proc_restart: GPU原地热恢复 proc_restart: 进程原地重启 pod_reschedule: Pod级重调度 job_reschedule: Job级重调度 job_reschedule_with_taint: 隔离式Job重调度

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
删除训练作业版本 - AI开发平台ModelArts

aining-jobs/10/versions/10 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Error string",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
更新训练作业描述 - AI开发平台ModelArts

"This is a ModelArts job" } 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Error string",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除可视化作业 - AI开发平台ModelArts

_id}/visualization-jobs/10 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "This job can't be delete

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
Manifest管理概述 - AI开发平台ModelArts

各个使用场景，同时兼顾数据集管理的灵活性，本文档描述数据集管理的接口和描述规范——Manifest文件。 Manifest文件中定义了标注对象和标注内容的对应关系。Manifest文件中也可以只有原始文件信息，没有标注信息，如生成的未标注的数据集。 Manifest文件使用UTF

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
动态挂载OBS - AI开发平台ModelArts

在运行中的Notebook实例，支持将“OBS并行文件系统”挂载到实例中指定的文件目录，挂载后可以在容器中以文件系统操作方式完成OBS并行文件系统对象的读写。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成S

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询训练作业列表 - AI开发平台ModelArts

指定作业所处的工作空间，默认值为“0”。请求消息无。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。调用成功时无此字段。 error_code

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。训练框架使用的是ModelLink。本方案目前仅适用于部分企业客户，完成本方案

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
推理专属预置镜像列表 - AI开发平台ModelArts

推理专属预置镜像列表 ModelArts的推理平台提供了一系列的基础镜像，用户可以基于这些基础镜像构建自定义镜像，用于部署推理服务。 X86架构（CPU/GPU）的推理基础镜像表1 TensorFlow AI引擎版本支持的运行环境镜像名称 URI 2.1.0 CPU GPU(cuda10

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？问题定位和处理创建模型失败有两种场景：创建模型时直接报错或者是调用API报错和创建模型任务下发成功，但最终模型创建失败。创建模型时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。创建模型任务

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
删除训练作业 - AI开发平台ModelArts

oject_id}/training-jobs/10 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Error string",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除训练作业参数 - AI开发平台ModelArts

b-configs/test-trainconfig 响应示例成功响应示例 { "is_success": true } 失败响应示例 { "is_success": false, "error_message": "Error string",

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置

总条数： 1731

上一页
1
...
66
67
68
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

查询可视化作业列表 - AI开发平台ModelArts

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

更新可视化作业描述 - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

删除可视化作业 - AI开发平台ModelArts

Manifest管理概述 - AI开发平台ModelArts

动态挂载OBS - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理专属预置镜像列表 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

删除训练作业参数 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线