搜索_华为云

ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

02:33 AI开发流程科普视频特性讲解昇腾云服务产品介绍 03:55 了解什么是昇腾云服务华为云ModelArts服务视频训练作业容错检查功能介绍 04:48 了解什么是训练作业容错检查功能华为云ModelArts服务视频高可用冗余节点功能介绍 03:07 了解什么是高可用冗余节点功能

 帮助中心 > AI开发平台ModelArts > 视频帮助
CUDA和CUDNN - AI开发平台ModelArts
CUDA和CUDNN - AI开发平台ModelArts

方法。专属池驱动版本如何升级？当专属资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力，具体操作请参见资源池驱动升级。父主题： FAQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
创建和管理团队 - AI开发平台ModelArts

在“标注团队”管理页面，单击“添加团队”。在弹出的“添加团队”对话框中，填写团队“名称”和“描述”，然后单击“确定”。完成标注团队的添加。团队添加完成后，“标注团队”管理页面呈现新添加的团队，在页面右侧区域，可以查看团队详情。新添加的团队，其成员列表为空，请参考添加成员操作，为您的团队添加成员。添加成员

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？欠费后，ModelArts的资源不会被立即删除。欠费后，您可以在“费用中心”查看欠费详情。为了防止相关资源不会被停止服务或者逾期释放，您需要及时进行还款或充值。查询欠费步骤登录管理控制台。单击页面右上角的“费用”进入“费用中心”页面。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？场景描述在使用ModelArts进行自定义深度学习训练时，训练数据通常存储在对象存储服务（OBS）中，且训练数据较大时（如200GB以上），每次都需要使用GPU资源池进行训练，且训练效率低。希望提升训练效率，同时减少与对象存储OBS的交互。可通过如下方式进行调整优化。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？为了方便AI开发者在使用Notebook时访问外部资源，ModelArts提供了一个免费的共享网络代理服务。借助这个代理，开发者可以更加便捷地下载所需的各类资源，助力开发工作的顺利进行。由于该网络代理免费且共

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
配置节点参数控制分支执行 - AI开发平台ModelArts

支持单节点通过参数配置或者获取训练输出的metric指标信息来决定执行是否跳过，同时可以基于此能力完成对执行流程的控制。应用场景主要用于存在多分支选择执行的复杂场景，在每次启动执行后需要根据相关配置信息决定哪些分支需要执行，哪些分支需要跳过，达到分支部分执行的目的，与ConditionStep的使用场景类

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
总览Workflow工作流 - AI开发平台ModelArts

contain表示模糊匹配。具体过滤的字段，由各个接口额外定义参数。例如Workflow支持按照名称（name）进行过滤，则相应的过滤字段为name。name=workflow&search_type=contain表示查询名称中含有Workflow字样的所有工作流。 name 否 String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
模型训练使用流程 - AI开发平台ModelArts

参来迭代模型；或在实验阶段，有一个可以优化训练的性能的想法，则会回到开发阶段，重新优化代码。图1 模型开发过程 ModelArts提供了模型训练的功能，方便您查看训练情况并不断调整您的模型参数。您还可以基于不同的数据，选择不同规格的资源池用于模型训练。请参考以下指导在ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
查询模型对象列表 - AI开发平台ModelArts

]，列表中元素model_instance对象即为本章节描述的模型管理，可调用模型接口。支持按照检索参数查询模型列表，返回满足检索条件的模型list，检索参数如表1所示。在查询列表时，返回list的同时，会打印模型列表的详细信息，如表2和表3所示。当前支持最大获取150个模型对象。表1

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
创建团队标注任务 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 auto_sync_dataset 否 Boolean 团队标注任务的标注结果是否自动同步至数据集。可选值如下： true：团队标注任务的标注结果自动同步至数据集（默认值）

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

选择代码目录中训练作业的Python启动脚本。例如“obs://test-modelarts/code/main.py”。超参当资源规格为单机多卡时，需要指定超参world_size和rank。当资源规格为多机时（即实例数大于 1），无需设置超参world_size和rank，超参会由平台自动注入。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
更新标注团队 - AI开发平台ModelArts

标注团队描述，长度为0-256位，不能包含^!<>=&"'特殊字符。 workforce_name 否 String 标注团队的名称，1~64长度，只能包含字母、数字、中划线和下划线。响应参数无请求示例更新标注团队 { "description" : "my team" } 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询专属资源池作业统计信息 - AI开发平台ModelArts

Queue Integer 排队中的作业个数。 Pending Integer 等待中的作业个数。 Abnormal Integer 异常的作业个数。 Terminating Integer 终止中的作业个数。 Creating Integer 创建中的作业个数。 Running Integer

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
ModelArts控制台为什么能看到创建失败被删除的专属资源池？ - AI开发平台ModelArts

ModelArts控制台为什么能看到创建失败被删除的专属资源池？在控制台页面操作删除专属资源池后，后端服务需要进行资源实例释放。在资源实例释放过程中，用户依然可以查询到资源池。如果需要创建专属资源池，建议等待5min后再创建，且不要使用已创建过的专属资源池名称来命名新建的专属资源池。如果做UI自动化测试，建议用例用随机串替代。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
查询标注团队详情 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 create_time Long 标注团队的创建时间。 description String 标注团队的描述。 update_time

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

HostName：IP地址 - Port：端口号在VS Code中手工配置远程连接时，在本地的ssh config文件中增加配置参数“StrictHostKeyChecking no”和“UserKnownHostsFile=/dev/null” Host xxx HostName

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
ModelArts线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

ModelArts线上训练得到的模型是否支持离线部署在本地？通过ModelArts预置算法训练得到的模型是保存在OBS桶里的，模型支持下载到本地。在训练作业列表找到需要下载模型的训练作业，单击名称进入详情页，获取训练输出路径。图1 获取训练输出位置单击“输出路径”，跳转至OBS对象路径，下载训练得到的模型。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
开启训练故障自动重启功能 - AI开发平台ModelArts

int机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 current Integer 当前页数。 data Array of DataVolumesRes objects 数据。 pages Integer 总的页数。 size

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 2555

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts - AI开发平台ModelArts

CUDA和CUDNN - AI开发平台ModelArts

创建和管理团队 - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

在ModelArts上如何提升训练效率并减少与OBS的交互？ - AI开发平台ModelArts

在ModelArts的Notebook中，访问外网速度不稳定怎么办？ - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

更新标注团队 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

ModelArts控制台为什么能看到创建失败被删除的专属资源池？ - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

报错“Host key verification failed.'或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

ModelArts线上训练得到的模型是否支持离线部署在本地？ - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线