搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

TP×PP×CP)的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
使用MaaS压缩模型 - AI开发平台ModelArts

开关关闭（默认关闭）：表示不永久保存日志，则任务日志会在30天后会被清理。可以在任务详情页下载全部日志至本地。开关打开：表示永久保存日志，此时必须配置“日志路径”，系统会将任务日志永久保存至指定的OBS路径。事件通知选择是否打开“事件通知”开关。开关关闭（默认关闭）：表示不启用消息通知服务。开关打

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
构建条件节点控制分支执行 - AI开发平台ModelArts

# 训练使用的算法对象，示例中使用AIGallery订阅的算法；部分算法超参的值如果无需修改，则在parameters字段中可以不填写，系统自动填充相关超参值 inputs=wf.steps.JobInput(name="data_url", data=obs_data)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

否，使用Token认证时必选。 - X-Sdk-Date 请求的发生时间，格式为(YYYYMMDD'T'HHMMSS'Z')。取值为当前系统的GMT时间。否，如果使用AK/SK做接口认证的时候，那么此字段必须设置；如果使用PKI token的时候，不必设置。 20190307T101459Z

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
创建ModelArts数据选择任务 - AI开发平台ModelArts

在“数据处理”页面，单击“创建”进入“创建数据处理”页面。在创建数据处理页面，填写相关算法参数。填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。设置场景类别。场景类别当前支持“图像分类”和“物体检测”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
管理训练容器环境变量 - AI开发平台ModelArts

强化学习引擎为learner，worker TensorFlow为ps，worker “MA_TASK_NAME=worker” MA_NUM_HOSTS 计算节点个数。系统自动从资源参数的“计算节点个数”中读取。 “MA_NUM_HOSTS=4” VC_TASK_INDEX 当前容器索引，容器从0开始编号。单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
SFT全参微调训练 - AI开发平台ModelArts

TP×PP×CP)的值进行整除。 Step4 开启训练故障自动重启功能创建训练作业时，可开启自动重启功能。当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图3 开启故障重启断

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
设置训练故障优雅退出 - AI开发平台ModelArts

dataset = create_dataset() loss_cb = LossMonitor() cb = [loss_cb] if int(os.getenv('RANK_ID')) == 0: batch_num = dataset.get_dataset_size() # 开启优雅退出保存

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1 docker tag swr.cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

有效期；当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态，资源将陆续进入宽限期和保留期。图2 按需计费资源生命周期欠费预警系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账户被扣为负值时，我们将通过邮件、短信和站内信的方式通知到华为云账号的创建者。欠费后影响

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

ci0。 ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

I应用，建议您提供AI应用的说明文档。单击“添加AI应用说明”，设置“文档名称”及其“URL”。AI应用说明支持增加3条。 “配置文件” 系统默认关联您存储在OBS中的配置文件。打开开关，您可以直接在当前界面查看或编辑模型配置文件。说明：该功能即将下线，后续请根据“AI引擎”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

String 模型名称，名称只能字母，中文开头，为字母、数字、下划线、中文或者中划线组成的合法字符，支持1-64个字符。如果未输入该参数，系统会自动生成模型name。 model_version 是 String 模型版本，格式需为“数值.数值.数值”，其中数值为1-2位正整数。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
Lite Cluster资源配置流程 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1 docker tag swr.cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
创建ModelArts数据校验任务 - AI开发平台ModelArts

在“数据处理”页面，单击“创建”进入“创建数据处理”页面。在创建数据处理页面，填写相关算法参数。填写基本信息。基本信息包括“名称”、“版本”和“描述”。其中“版本”信息由系统自动生成，按“V0001”、“V0002”规则命名，用户无法修改。您可以根据实际情况填写“名称”和“描述”信息。图1 创建数据处理基本信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

0528150158-b521cc0 镜像发布到SWR，从SWR拉取固件驱动：23.0.5 CANN：cann_8.0.rc2 容器镜像OS：hce_2.0 PyTorch：pytorch_2.1.0 FrameworkPTAdapter：6.0.RC2 如果用到CCE，版本要求是CCE

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

名称：创建数据集名称，为方便后续创建物体检测项目选择对应的数据集，建议您的数据集名称具有可识别性。描述：描述数据集详细信息。图1 下载详情确认无误后单击右下角“确定”。系统会跳转到我的下载页面，单击按钮，查看下载进度，等待数据集下载完成（下载完成大约需要5分钟，请耐心等待）。单击展开下载详情，可以查看该数据集的“目标位置”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

参数说明： -v ${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
配置ModelArts委托授权 - AI开发平台ModelArts

新增委托：如果没有委托可选，可以在新增委托中创建委托权限。对于首次使用ModelArts的用户，需要新增委托。 “新增委托 > 委托名称” 系统自动创建委托名称，用户可以手动修改。 “新增委托 > 授权方式” 角色授权：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权

总条数： 575

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

构建条件节点控制分支执行 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

创建ModelArts数据选择任务 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

设置训练故障优雅退出 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

从OBS中导入AI应用文件创建模型 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

Wav2Lip基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

创建ModelArts数据校验任务 - AI开发平台ModelArts

昇腾云服务6.3.905版本说明 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线