搜索_华为云

创建数据处理任务版本 - AI开发平台ModelArts

数据处理任务的工作目录。 workspace_id 否 String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表3 ProcessorDataSource 参数是否必选参数类型描述 name 否 String 数据集的名称。 source

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败问题现象使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败。版本详情的报错信息如下： Insufficient storage

帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
工具介绍及准备工作 - AI开发平台ModelArts

本章节主要介绍针对LLaMAFactory开发的测试工具benchmark，支持训练、性能对比、下游任务评测、loss和下游任务对比能力。对比结果以excel文件呈现。方便用户验证发布模型的质量。所有配置都通过yaml文件设置，用户查看默认yaml文件即可知道最优性能的配置。目前仅支持SFT指令监督微调训练阶段。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
创建工作空间 - AI开发平台ModelArts

状态描述，默认为空。该字段会补充显示状态的详细信息。如删除失败时，可通过该字段查看删除失败的原因。 grants Array of grants objects 授权用户列表。默认为空。需要与“auth_type”参数配合使用，且仅当授权类型为“INTERNAL”时才会生效。表6 grants

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
附录：部署常见问题 - AI开发平台ModelArts

enough“的问题问题：容器共享内存不足解决方法：在启动docker的命令中增加“--shm-size=${memSize}“，其中memSize为要设置的共享内存大小，如2g。 --shm-size 2g \ 如何解决MindIE服务已退出情况下显存依然占用的问题问题：服务退出显存未完全释放

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
如何通过docker镜像启动容器？ - AI开发平台ModelArts

Notebook保存后的镜像有Entrypoint参数，如图1。Entrypoint参数中指定的可执行文件或命令会覆盖镜像的默认启动命令，Entrypoint中指定的执行命令内容不在镜像中预置，在本地环境通过docker run启动通过Notebook保存的镜像，报错创建容器任务失败，启动文件或目录不存在，如图2。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
创建网络资源 - AI开发平台ModelArts

Turbo的ID。 name String SFS Turbo的名称。 status String 与SFS Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

权。普通用户：普通用户的委托权限包括了用户使用ModelArts完成AI开发的所有必要功能权限，如数据的访问、训练任务的创建和管理等。一般用户选择此项即可。自定义：如果对用户有更精细化的权限管理需求，可使用自定义模式灵活按需配置ModelArts创建的委托权限。可以根据实际需在权限列表中勾选要配置的权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
查询预置算法 - AI开发平台ModelArts

Integer 指定每一页展示作业参数的总量，默认为10，“per_page”可选的范围为[1，100]。 page 否 Integer 指定要查询页的索引，默认为1。 sortBy 否 String 指定查询的排序方式，默认是根据引擎查找“engine”，目前支持的排序还有模型名称“mode

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询训练作业列表 - AI开发平台ModelArts

Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的每页条目数。最小为1，最大为50。 offset Integer 查询作业的页数，最小为0。例如设置为0，则表示从第一页开始查询。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

介绍ModelArts所有功能涉及到的IAM权限配置。 IAM权限简介如果您需要为企业中的员工设置不同的权限访问ModelArts资源，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：计算规格：不同模型训练推荐的NPU卡数请参见不同模型推荐的参数与NPU卡数设置。硬盘空间：至少200GB。昇腾资源规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：计算规格：不同模型训练推荐的NPU卡数请参见不同模型推荐的参数与NPU卡数设置。硬盘空间：至少200GB。昇腾资源规格：

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
训练作业找不到GPU - AI开发平台ModelArts

根据报错提示，请您排查代码，是否已添加以下配置，设置该程序可见的GPU： os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3,4,5,6,7' 其中，0为服务器的GPU编号，可以为0，1，2，3等，表明对程序可见的GPU编号。如果未进行添加配置则该编号对应的GPU不可用。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
注册自定义镜像 - AI开发平台ModelArts

使用。 workspace_id String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求示例注册自定义镜像。设置镜像支持的规格为“CPU”，支持的处理器架构类型为“X86_64”。 { "description" : ""

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
管理训练容器环境变量 - AI开发平台ModelArts

作业元信息环境变量约束限制为了避免新设置的环境变量与系统环境变量冲突，而引起作业运行异常或失败，请在定义自定义环境变量时，不要使用“MA_”开头的名称。如何修改环境变量用户可以在创建训练作业页面增加新的环境变量，也可以设置新的取值覆盖当前训练容器中预置的环境变量值。为保证数据安全，请勿输入敏感信息，例如明文密码。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

Arts监控服务。设置告警规则有多种方式。您可以根据实际应用场景，选择设置告警规则的方式。对ModelArts服务设置告警规则对单个服务设置告警规则对模型版本设置告警规则对服务或模型版本的单个指标设置告警规则方式一：对整个ModelArts服务设置告警规则登录管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
精度调优前准备工作 - AI开发平台ModelArts

学习率预热不同的学习率调度器（决定什么阶段用多大的学习率）有不同的学习率调度相关超参，例如线性调度可以选择从一个初始学习率lr-warmup-init开始预热。您可以选择多少比例的训练迭代步使用预热阶段的学习率。不同的训练框架有不同的参数命名，需要结合代码实现设置对应的参数。模型结构

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
ModelArts中常用概念 - AI开发平台ModelArts

指按某种策略由已知判断推出新判断的思维过程。人工智能领域下，由机器模拟人类智能，使用构建的神经网络完成推理过程。在线推理在线推理是对每一个推理请求同步给出推理结果的在线服务（Web Service）。批量推理批量推理是对批量数据进行推理的批量作业。昇腾芯片昇腾芯片又叫

 帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
执行训练任务【旧】 - AI开发平台ModelArts

当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoint，中间不需要改动任何参数。可以通过训练脚本中的SAVE_INTERVAL参数来指定间隔多少step保存checkpoint。如果要使用自动重启功能，资源规格必须选择八卡规格。训练作业中的训练故障自动恢复功能包括：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务

总条数： 1656

上一页
1
...
5
6
7
...
83
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建数据处理任务版本 - AI开发平台ModelArts

使用Qwen2.5-72B-1K、Qwen2.5-32B调优的Checkpoint创建模型时，权重校验失败 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

附录：部署常见问题 - AI开发平台ModelArts

如何通过docker镜像启动容器？ - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

训练作业找不到GPU - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

精度调优前准备工作 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

执行训练任务【旧】 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线