搜索_华为云

查看训练作业日志 - AI开发平台ModelArts

527-41b8-971c-eca55e513254-worker-0.log 单机训练作业只会生成一个日志文件，单机作业的task id默认为worker-0。分布式场景下有多个节点日志文件并存，通过task id区分不同节点，例如：worker-0，worker-1等。训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
在MaaS中创建模型 - AI开发平台ModelArts

支持1~64位，以中文、大小写字母开头，只包含中文、大小写字母、数字、下划线（_）、中划线（-）和（.）。描述模型简介。支持100字符。权重设置与词表默认选择“使用推荐权重”，支持选择“自定义权重”。 “使用推荐权重”：使用平台推荐的权重文件，可提高模型的训练、压缩、部署和调优等服务的使用效率。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

名称模型名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。版本设置所创建模型的版本。第一次导入时，默认为0.0.1。说明：模型创建完成后，可以通过创建新版本，导入不同的元模型进行调优。描述模型的简要描述。填写元模型来源及其相关参数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
从Manifest文件导入规范说明 - AI开发平台ModelArts

t" } 表1 字段说明字段是否必选说明 source 是被标注对象的URI。数据来源的类型及示例请参考表2。 usage 否默认为空，取值范围： TRAIN：指明该对象用于训练。 EVAL：指明该对象用于评估。 TEST：指明该对象用于测试。 INFERENCE：指明该对象用于推理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
查询服务监控信息 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 node_id 否 String 待查询的边缘节点ID，仅当infer_type为edge时可指定，默认查询所有节点。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户To

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询专属资源池作业列表 - AI开发平台ModelArts

是否按照升序排序。 offset 否 String 分页查询，起始位置。 limit 否 Integer 单页查询最大数量，值为空或者0时默认为500，最大值为500。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

开通自动续费后，还可以手动续费该专属资源池。手动续费后，自动续费仍然有效，在新的到期时间前的第7天开始扣款。自动续费的到期前7日自动扣款属于系统默认配置，您也可以根据需要修改此扣款日，如到期前6日、到期前5日等。更多关于自动续费的规则介绍请参见自动续费规则说明。前提条件请确认包年/包月专属资源池还未到期。

帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
从OBS目录导入数据到数据集 - AI开发平台ModelArts

“数据来源”：“OBS” “导入方式”：“目录”。 “导入路径”：数据存储的OBS路径。 “数据标注状态”：已标注。 “高级特征选项 ”：默认关闭，可通过勾选高级选项提供增强功能。如“按标签导入”：系统将自动获取此数据集的标签，您可以单击“添加标签”添加相应的标签。此字段为可选

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
更新API授权 - AI开发平台ModelArts

Apps objects app列表。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String APP的编号，可通过查询APP列表获取。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

启动MindInsight 在开发环境的JupyterLab中打开MindInsight。单击，直接进入MindInsight可视化界面。默认读取路径/home/ma-user/work/ 当存在两个以及以上工程的log时，界面如下。通过Runs下选择查看相对应的log。图1 MindInsight界面（2）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
增量模型训练 - AI开发平台ModelArts

uts/train_url_0" train_url = args.train_url # 判断输出路径中是否有模型文件。如果无文件则默认从头训练，如果有模型文件，则加载epoch值最大的ckpt文件当做预训练模型。 if os.listdir(train_url):

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
创建节点池 - AI开发平台ModelArts

当计费模式为包周期时该参数必传。 os.modelarts/auto.renew 否 String 是否自动续费.可选值如下： 0：不自动续费，默认值 1：自动续费 os.modelarts/promotion.info 否 String 用户在运营平台选择的折扣信息。 os.modelarts/service

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
创建处理任务 - AI开发平台ModelArts

”，其他类型任务均设为“false”或不设。可选值如下： true：创建任务时同步创建一个任务版本 false：创建任务时不创建任务版本（默认值） data_source 否 ProcessorDataSource object 数据来源，与inputs二选一。数据源路径不支持设置为KMS加密桶中的OBS路径。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
执行微调训练任务 - AI开发平台ModelArts

ZeRO-3-Offload，配置以下参数 deepspeed: examples/deepspeed/ds_z3_offload_config.json 否，默认选用Accelerate加速深度学习训练框架，注释掉deepspeed参数。是否开启NPU FlashAttention融合算子，具体约

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
数据集版本发布失败 - AI开发平台ModelArts

进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶，可单击“默认加密”选项进行修改。图1 OBS桶是否加密确保归档数据直读功能关闭进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
日志提示"Permission denied" - AI开发平台ModelArts

sh脚本没有执行权限，可以在自定义脚本启动前执行"chmod +x xxx.sh"添加可执行权限。 ModelArts控制台上创建训练作业自定义镜像入口，默认以1000 uid用户来启动v2容器镜像，将ma-user的uid从1102改为1000，改变方式如下（假若需要sudo权限，可取消sudoers行的注释）：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

格。图2 报错信息 ECS、EVS配额不足，导致创建失败？集群所需的ECS实例数、内存大小、CPU核数和EVS硬盘大小资源会超出华为云默认提供的资源配额，因此需要申请扩大配额。解决方法请参见申请扩大资源配额。图3 报错信息（1）图4 报错信息（2）资源售罄或容量不足，导致创建失败？

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
授权API至APP - AI开发平台ModelArts

Apps objects app列表。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表4 Apps 参数是否必选参数类型描述 app_id 否 String APP的编号，可通过查询APP列表获取。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
准备Notebook - AI开发平台ModelArts

图1 Notebook中选择自定义镜像与规格存储配置选择“弹性文件服务SFS”，并且选择已创建的SFS Turbo实例，子目录挂载可选择默认不填写。如果该SFS Turbo多人共用，则推荐用户编辑“子目录挂载”，创建自己的子目录进行划分。图2 Notebook中选择弹性文件服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
附录：训练常见问题 - AI开发平台ModelArts

tils.py 问题4：Error waiting on exit barrier错误错误截图：报错原因：多线程退出各个节点间超时时间默认为300s，时间设置过短。解决措施：修改容器内torch/distributed/elastic/agent/server/api.py文件参数：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）

总条数： 946

上一页
1
...
38
39
40
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看训练作业日志 - AI开发平台ModelArts

在MaaS中创建模型 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

查询专属资源池作业列表 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

从OBS目录导入数据到数据集 - AI开发平台ModelArts

更新API授权 - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

创建节点池 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

资源池创建失败的原因与解决方法？ - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线