搜索_华为云

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

创建方式选择“自定义算法”。启动方式选择“预置框架”，引擎选择“PyTorch”，PyTorch版本根据训练要求选择。代码目录选择OBS桶中训练code文件夹所在路径，例如“obs://test-modelarts/code/”。启动文件选择代码目录中训练作业的Pyth

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
训练好的模型是否可以下载或迁移到其他账号？如何获取下载路径？ - AI开发平台ModelArts

下载路径。模型迁移到其他账号您可以通过如下两种方式将训练的模型迁移到其他账号。将训练好的模型下载至本地后，上传至目标账号对应区域的OBS桶中。通过对模型存储的目标文件夹或者目标桶配置策略，授权其他账号进行读写操作。详请参见配置高级桶策略。父主题：查看作业详情

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 查看作业详情
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

下载完成后，将数据上传至SFS相应目录中。由于数据集过大，推荐先通过obsutil工具将数据集传到OBS桶后，再将数据集迁移至SFS。在本机机器上运行，通过obsutil工具将本地数据集传到OBS桶。 # 将本地数据传至OBS中 # ./obsutil cp ${数据集所在的本地文件夹路径}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
开发用于预置框架训练的代码 - AI开发平台ModelArts

练输入路径参数和训练输出路径参数。这四种输入搭建了用户代码和ModelArts Standard后台交互的桥梁。代码目录路径您需要在OBS桶中指定代码目录，并将训练代码、依赖安装包或者预生成模型等训练所需文件上传至该代码目录下。训练作业创建完成后，ModelArts会将代码目录及其子目录下载至后台容器中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
分离部署推理服务 - AI开发平台ModelArts

类型type、属性properties，必需属性required 、定义definitions等，JSON Schema通过定义对象属性、类型、格式的方式来引导模型生成一个包含用户信息的JSON对象。如果希望使用JSON Schema，guided_json的写法可参考outlines: Structured

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
资源选择推荐 - AI开发平台ModelArts

SFS（存放数据和代码）”。多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存储方案使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

Code插件创建训练作业并调试。使用VS Code插件创建训练作业并调试功能目前是白名单，需要提交工单申请开通。准备工作创建OBS桶，桶名称示例：“xxx-project”，在OBS桶里创建“data”文件夹。（建议下载OBS Browser+进行相关操作）。上传本地数据至“data”文件夹

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架LlamaFactory+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite DevServer上的微调方案，包括SFT全参微调、LoRA微调、DPO训练方案。 DPO(Direct Preference

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
升级Standard专属资源池驱动 - AI开发平台ModelArts

升级Standard专属资源池驱动场景介绍当专属资源池中的节点含有GPU/Ascend资源时，用户基于自己的业务，可能会有自定义GPU/Ascend驱动的需求，ModelArts面向此类客户提供了自助升级专属资源池GPU/Ascend驱动的能力。驱动升级有两种升级方式：安全升级、强制升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
pipeline代码适配 - AI开发平台ModelArts

use_ascend: 是否使用Ascend onnx_runtime_model: onnx模型对象 get_shape: 是否获取模型shape信息、输入数据shape信息 resize_shape:

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
查询训练作业详情 - AI开发平台ModelArts

方式二：根据创建训练作业生成的训练作业对象查询。 job_info = job_instance.get_job_info() print(job_info) 参数说明表1 Estimator请求参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参考Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
终止训练作业 - AI开发平台ModelArts

方式二：根据创建训练作业生成的训练作业对象终止。 job_instance.control_job() 参数说明表1 control_job_by_id请求参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法请参考Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

S（存放数据和代码）”。多机多卡：大数据量（1T训练数据）、高算力场景（4台8卡Vnt1），存储方案推荐使用“SFS（存放数据）+普通OBS桶（存放代码）”，采用分布式训练。当使用SFS+OBS的存储方案可以实现存储加速，该方案的端到端实践案例请参见面向AI场景使用OBS+SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
训练的数据集预处理说明 - AI开发平台ModelArts

handler-name参数说明数据集预处理中 --handler-name 都会传递参数，用于构建实际处理数据的handler对象，并根据handler对象对数据集进行解析。文件路径在：ModelLink/modellink/data/data_handler.py。基类BaseDatasetHandler解析

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练的数据集预处理说明 - AI开发平台ModelArts

handler-name参数说明数据集预处理中 --handler-name 都会传递参数，用于构建实际处理数据的handler对象，并根据handler对象对数据集进行解析。文件路径在：ModelLink/modellink/data/data_handler.py。基类BaseDatasetHandler解析

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 训练脚本说明
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） ComfyUI是一款基于节点工作流的Stable Diffusion操作界面。通过将Stable Diffusion的流程巧妙分解成各个节点，成功实现了工作流的精确定制和可靠复现

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
创建开发环境实例 - AI开发平台ModelArts

说明 path 否 String 存储路径。如果type为“obs”类型，该值必须填写，该值需为有效的OBS桶路径，且以“/”结束。不能指定为OBS桶的根目录，需指定为OBS桶下的具体目录。如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
创建AI应用 - AI开发平台ModelArts

String JSON Schema中表示类型的字段，可选object。 properties 否 Object JSON Schema中表示对象元素的properties字段，可在其中定义参数，包括参数名及其类型。表11 CreateModelRequestInferParams

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

登录AOM控制台在左侧导航栏选择“告警 > 告警规则”，在右上角单击“添加告警”。设置告警规则（以NPU掉卡为例）。规则类型：选择阈值类告警。监控对象：选择命令行输入。命令行输入框： sum(nt_npg{type="NT_NPU_CARD_LOSE"} !=2) by (cluster_name

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

单击“确定”。为子账号配置ModelArts委托权限。在ModelArts服务页面的左侧导航选择“权限管理 ”，单击“添加授权”。授权对象选择子账号，在已有委托中选择新建的委托，然后单击“创建”。验证权限是否配置成功。登录子账号，如果用户能跑通在开发环境中构建并调试推理镜

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践

总条数： 1110

上一页
1
...
49
50
51
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

训练好的模型是否可以下载或迁移到其他账号？如何获取下载路径？ - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线