搜索_华为云

训练作业容错检查 - AI开发平台ModelArts

环境检测。打开开关后，允许设置重启次数为1~128次。图5 自动重启设置使用API接口设置容错检查：用户可以通过API接口的方式开启自动重启。创建训练作业时，在“metadata”字段的“annotations”中传入“fault-tolerance/job-retry-num”字段。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
在MaaS体验模型服务 - AI开发平台ModelArts

Studio大模型即服务平台。有两种方式进入体验页面，任选一种方式进入即可。方式一在ModelArts Studio左侧导航栏中，选择“模型体验”进入体验页面。在“模型体验”页面，单击“请选择服务”，选择要体验的模型服务，单击“确定”。方式二在ModelArts Stud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

处理方法公共资源池容器Docker size的大小最大支持50G，专属资源池Docker size的大小最大支持50G。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
Lite Cluster使用流程 - AI开发平台ModelArts

ModelArts Lite Cluster面向k8s资源型用户，提供托管式k8s集群，并预装主流AI开发插件以及自研的加速插件，以云原生方式直接向用户提供AI Native的资源、任务等能力，用户可以直接操作资源池中的节点和k8s集群。本文旨在帮助您了解Lite Cluster的基本使用流程，帮助您快速上手。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

引擎空间的默认为50G，专属资源池容器引擎空间可在创建资源池时自定义设置，设置专属资源池容器引擎空间不会造成额外费用增加。如果使用的是OBS导入或者训练导入，则包含基础镜像、模型文件、代码、数据文件和下载安装软件包的大小总和。如果使用的是自定义镜像导入，则包含解压后镜像和镜像下载文件的大小总和。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

在Terminal或ipynb文件中直接调用ModelArts SDK的接口。在Notebook中调用SDK，可直接参考接口说明，执行OBS管理、作业管理、模型管理和服务管理等操作。 ModelArts SDK支持在本地安装配置使用。使用时，需进行Session鉴权。本地安装

 帮助中心 > AI开发平台ModelArts > SDK参考
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

完成资源的申请。步骤1 安装模型安装Megatron-DeepSpeed框架。使用root用户SSH的方式登录GPU裸金属服务器。具体登录方式请参见SSH密钥方式登录裸金属服务器。拉取pytorch镜像，可以选择常用的镜像源进行下载。 docker pull nvcr.

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
计费说明 - AI开发平台ModelArts
计费说明 - AI开发平台ModelArts

需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。 ModelArts服务的计费方式简单、灵活，您既可以选择按实际使用时长计费，也可以选择更经济的按包周期（包年/包月）计费方式。详细的费用价格请参见产品价格详情。更多详细的计费介绍，请参见《计费说明》文档。

帮助中心 > AI开发平台ModelArts > 产品介绍
Workflow多分支运行介绍 - AI开发平台ModelArts

Workflow多分支运行介绍当前支持两种方式实现多分支的能力，条件节点只支持双分支的选择执行，局限性较大，推荐使用配置节点参数控制分支执行的方式，可以在不添加新节点的情况下完全覆盖ConditionStep的能力，使用上更灵活。构建条件节点控制分支执行主要用于执行流程的条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。支持创建新版本创建新版本，仅支持从ModelArts训练作业、OBS、模型模板、或自定义镜像中选择元模型。无法从原自动学习项目中，创建新版本。支持删除模型或其模型版本父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。支持创建新版本创建新版本，仅支持从ModelArts训练作业、OBS、模型模板、或自定义镜像中选择元模型。无法从原自动学习项目中，创建新版本。支持删除模型或其模型版本父主题：使用窍门

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用窍门
执行训练任务（推荐） - AI开发平台ModelArts

执行训练任务（推荐）新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。推荐用户使用该方式进行训练。步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
执行训练任务（推荐） - AI开发平台ModelArts

传数据到指定目录章节完成。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。步骤二修改训练Yaml配置文件权重文件支持以下组合方式，用户根据自己实际要求选择：训练stage 不加载权重增量训练：加载权重，不加载优化器（默认开启）断点续训：加载权重+优化器 pt sft

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
使用MaaS压缩模型 - AI开发平台ModelArts

5-72B √ x Qwen2.5-32B √ √ 前提条件在“我的模型”页面存在已创建成功的模型。已准备好用于存放压缩后模型权重文件的OBS桶，OBS桶必须和MaaS服务在同一个Region下。创建压缩作业登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Standard模型部署 - AI开发平台ModelArts

ts支持将训练好的模型一键部署到端、边、云的各种设备上和各种场景上，并且还为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式部署方式。图1 部署模型的流程在线推理服务，可以实现高并发，低延时，弹性伸缩，并且支持多模型灰度发布、A/B测试。支持各种部署场景，既能部署

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
发布本地AI应用到AI Gallery - AI开发平台ModelArts

发布本地AI应用到AI Gallery 场景描述 AI Gallery自定义AI应用能力为您提供了一个自由灵活的AI应用创建方式，您可以基于AI Gallery上提供的基础能力，发挥您的创造力，通过自定义代码的形式，自由地构建出您需要的AI应用形态。准备AI应用运行文件“app

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
资产识别与管理 - AI开发平台ModelArts

Gallery中的资产，AI Gallery会做统一的保存管理。对于文件类型的资产，AI Gallery会将资产保存在AI Gallery官方的OBS桶内。对于镜像类型的资产，AI Gallery会将资产保存在AI Gallery官方的SWR仓库内。对于用户提供的一些个人信息，AI

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查看批量服务详情 - AI开发平台ModelArts

本次批量服务的任务结束时间。描述您可以单击编辑按钮，添加服务描述。输入数据目录位置本次批量服务中，输入数据的OBS路径。输出数据目录位置本次批量服务中，输出数据的OBS路径。模型名称＆版本本次批量服务所使用的模型名称及版本。运行日志输出默认关闭，批量服务的运行日志仅存放在ModelArts日志系统。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

息写入对应的Manifest文件中。数据集版本文件目录结构由于数据集是基于OBS目录管理的，发布为新版本后，对应的数据集输出位置，也将基于新版本生成目录。以图像分类为例，数据集发布后，对应OBS路径下生成，其相关文件的目录如下所示。 |-- user-specified-output-path

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理

总条数： 2258

上一页
1
...
93
94
95
...
113
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业容错检查 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

导入模型后部署服务，提示磁盘不足 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

在ModelArts中导入模型对于镜像大小有什么限制？ - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

计费说明 - AI开发平台ModelArts

Workflow多分支运行介绍 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

资产识别与管理 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

发布ModelArts数据集中的数据版本 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线