搜索_华为云

终止训练作业 - AI开发平台ModelArts

表55 SSHResp 参数参数类型描述 key_pair_names Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。 task_urls Array of TaskUrls objects SSH连接地址信息。表56

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练数据集预处理说明 - AI开发平台ModelArts

训练数据集预处理说明以 llama2-13b 举例，使用训练作业运行：obs_pipeline.sh 训练脚本后，脚本自动执行数据集预处理，并检查是否已经完成数据集预处理。如果已完成数据集预处理，则直接执行训练任务。若未进行数据集预处理，则会自动执行 scripts/llam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
创建工作流定时调度 - AI开发平台ModelArts

是否必选参数类型描述 type 否 String 类型，仅支持time（时间）。 content 否 Map<String,Object> 内容。 action 否 String 动作，仅支持run。 workflow_id 否 String Workflow工作流ID。 user_id

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
guided-decoding - AI开发平台ModelArts

JSON对象。其优势主要如下：上下文引导：通过提供特定的提示或上下文信息，模型可以更好地理解生成内容的方向。约束生成：可以设定某些限制条件，如关键词、主题或风格，使生成的内容更加一致和相关。提高质量：通过引导，生成的文本通常更具逻辑性和连贯性，减少无关信息的出现。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

--inputShape="input_ids:1,77" 在配置文件中指定输入shape。配置文件中通过“[ascend_context]”配置项指定input_shape，格式与命令行一致，多个输入，需要使用“;”隔开。然后在命令行中通过--configFile指定对应的配置文件路径即可。 # text_encoder

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

已准备好PyTorch框架的训练代码，例如将启动文件“test-pytorch.py”存放在OBS的“obs://cnnorth4-job-test-v2/pytorch/fast_example/code/cpu”目录下。已经准备好训练作业的数据文件，例如将训练数据集存放在OBS的“obs://

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
人工标注图片数据 - AI开发平台ModelArts

添加标签如果您还不太清楚如何进行标注，可参考数据集详情页面的“标注样例说明”完成标注。登录ModelArts管理控制台，选择“数据准备 > 数据标注”进入数据标注页。在“我创建的”或“我参与的”页签下，找到您需要标注的数据集。单击数据集名称，进入标注详情页。（默认直接进入“未标注”页签）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。文档更新内容 6.3.908版本相对于6.3.907版本新增如下内容：文档和代码中新增对mistral和mixtral模型的适配，并添加训练推荐配置。文档中新增对Llama3支持长序列文本（sequence_length > 32k）训练内容，例如新增参数context-parallel-size。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
文档导读 - AI开发平台ModelArts
文档导读 - AI开发平台ModelArts

文档导读本文档指导您如何安装和配置开发环境、如何通过调用ModelArts SDK提供的接口函数进行二次开发。章节内容 SDK简介简要介绍ModelArts SDK的概念。快速开始介绍如何使用ModelArts SDK进行二次开发。（可选）本地服务器安装ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

# 使用自定义镜像功能，通过torch.distributed.run命令启动训练的启动文件 torch_ddp.py内容如下： import os import torch import torch.distributed as dist import torch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

04内核版本从低版本升级至5.4.0-144-generic？如何禁止Ubuntu 20.04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容使用GPU A系列裸金属服务器有哪些注意事项？ GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 常见问题
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

CMD sh /home/mind/run.sh 启动入口文件run.sh需要自定义。示例如下： #!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

限制。这种场景下，建议找到原始镜像重新构建环境进行保存。解决方法找到原始镜像重新构建环境。建议使用干净的基础镜像，最小化的安装运行依赖内容，并进行安装后的软件缓存清理，然后保存镜像。父主题：自定义镜像故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
通过人工标注方式标注数据 - AI开发平台ModelArts

通过人工标注方式标注数据创建ModelArts人工标注作业人工标注图片数据人工标注文本数据人工标注音频数据人工标注视频数据管理标注数据父主题：标注ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
自定义镜像规范 - AI开发平台ModelArts

Gallery仓库内的地址，则填写相对路径。同时，还需要在“模型文件”添加gallery_train文件夹，文件夹内容参考表2。表2 gallery_train文件列表文件类型文件说明 “train_params.json” 必选文件，训练参数文件，定义了模型训练的必要参数，例如训练方式、超参

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
使用Msprobe工具分析偏差 - AI开发平台ModelArts

这里Step指定为0表示只对首个Step进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
配置ModelArts Standard访问授权 - AI开发平台ModelArts

配置ModelArts Standard访问授权快速配置ModelArts委托授权创建IAM用户并授权使用ModelArts 父主题： ModelArts Standard准备工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

“策略名称”：设置自定义策略名称，例如：不允许用户使用公共资源池创建。 “策略配置方式”：选择可视化视图或者JSON视图均可。 “策略内容”：拒绝，云服务中搜索“ModelArts”服务并选中，“操作”中查找写操作“modelarts:trainJob:create”、“mo

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
训练迁移快速入门案例 - AI开发平台ModelArts

因为自动迁移其实是对于torch运行环境中常用的GPU上的接口进行和昇腾设备的映射。原有的训练任务代码逻辑中例如数据集导入、预训练权重、GPU自定义算子的内容，以及对应的环境的超参数等内容都需要在实际的昇腾环境中进行调整。父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导

总条数： 1092

上一页
1
...
27
28
29
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

终止训练作业 - AI开发平台ModelArts

训练数据集预处理说明 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

guided-decoding - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

人工标注图片数据 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

文档导读 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

镜像保存时报错“The container size (xG) is greater than the threshold (25G)”如何解决？ - AI开发平台ModelArts

通过人工标注方式标注数据 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

配置ModelArts Standard访问授权 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线