搜索_华为云

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

WR Admin”策略。单击“下一步”和“确定”。图1 给用户组授权策略添加ModelArts委托授权。新建委托授权策略。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。 “策略名称”：设置自定义策略名称，例如：ma_agency_obs。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
标注结果存储在哪里？ - AI开发平台ModelArts

标注结果存储在哪里？ ModelArts管理控制台，提供了数据可视化能力，您可以在控制台中查看详细数据以及标注信息。如需了解标注结果的存储路径，请参见如下说明。背景说明针对ModelArts中的数据集，在创建数据集时，需指定“数据集输入位置”和“数据集输出位置”。两个参数填写的均是OBS路径。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
训练作业调测 - AI开发平台ModelArts

训练作业调测使用SDK调测单机训练作业使用SDK调测多机分布式训练作业父主题：训练作业

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
推理前的权重合并转换 - AI开发平台ModelArts

将多个权重文件合并为一个文件并转换格式任意并行切分策略的Megatron权重格式转化为 HuggingFace权重（该场景一般用于将训练好的megatron模型：预训练、lora、sft 重新转回HuggingFace格式）为下一步推理使用准备，无推理任务忽略此章节,一般训练都是多卡分布式训练权重结果文件为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

添加ModelArts委托授权。新建委托授权策略。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。 “策略名称”：设置自定义策略名称，例如：ma_agency_obs。 “策略配置方式”：选择可视化视图或者JSON视图均可。 “策略内容”：填入如下内容。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

] } 策略JSON格式字段介绍策略结构策略结构包括Version（策略版本号）和Statement（策略权限语句）两部分，其中Statement可以有多个，表示不同的授权项。图1 策略结构策略参数下面介绍策略参数详细说明。了解策略参数后，您可以根据场景自定义策略。具体可以参考文档自定义策略使用样例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

HPC型文件系统为用户提供一个完全托管的共享文件存储。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象，用户可以指定SFS Turbo内的目录与OBS对象存储桶进行关联，然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动，可以将最新的训练数据导入到SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

HPC型文件系统为用户提供一个完全托管的共享文件存储。SFS Turbo文件系统支持无缝访问存储在OBS对象存储桶中的对象，用户可以指定SFS Turbo内的目录与OBS对象存储桶进行关联，然后通过创建导入导出任务实现数据同步。通过OBS与SFS Turbo存储联动，可以将最新的训练数据导入到SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

费项包括存储空间和流量费用，目前均免费提供给您。企业版支持按需计费模式。购买的SWR可以用于上传自定义镜像。使用容器引擎客户端上传镜像对象存储服务OBS 对象存储服务提供按需计费和包年包月两种计费模式，用户可以根据实际需求购买OBS服务。 OBS服务支持以下两种存储方式，单

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
配置Lite Cluster存储 - AI开发平台ModelArts

Cluster存储如果没有挂载任何外部存储，此时可用存储空间根据dockerBaseSize的配置来决定，可访问的存储空间比较小，因此建议通过挂载外部存储空间解决存储空间受限问题。容器中挂载存储有多种方式，不同的场景下推荐的存储方式不一样，详情如表1所示。容器存储的基础知识了解

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

子账号的权限，由主用户来控制，主用户通过IAM的权限配置功能设置用户组的权限，从而控制用户组内的子账号的权限。此处的授权列表均按照ModelArts和其他服务的系统预置策略来举例。表1 服务授权列表待授权的服务授权说明 IAM权限设置是否必选 ModelArts 授予子账号使用ModelArts服务的权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
配置Lite Server存储 - AI开发平台ModelArts

配置Lite Server存储 Server服务器支持SFS、OBS、EVS三种云存储服务，提供了多种场景下的存储解决方案，主要区别如下表所示。若需要对本地盘进行配置，请参考物理机环境配置。表1 表1 SFS、OBS、EVS服务对比对比维度弹性文件服务SFS 对象存储服务OBS 云硬盘EVS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
附录：微调训练常见问题 - AI开发平台ModelArts

附录：微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据由于ModelArts本身没有数据存储的功能，ModelArts使用对象存储服务（Object Storage Service，简称OBS）进行数据存储以及模型的备份和快照，实现安全、高可靠和低成本的存储需求。 AI开发过程中的输入数据、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
不同机型的对应的软件配套版本 - AI开发平台ModelArts

BMS、RDMA且非ascend-1980 用于支持容器里使用RDMA网卡。 memarts 3.23.6-r002 无约束无约束近计算侧分布式缓存插件，用于存储加速。 os-node-agent 6.5.0-20240529142433 无约束无约束 OS插件，用于故障检测。 icAgent

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
创建训练作业 - AI开发平台ModelArts

训练作业的“/cache”目录是否安全？训练作业一直在等待中（排队）？创建训练作业时，超参目录为什么有的是/work有的是/ma-user？在ModelArts创建分布式训练时如何设置NCCL环境变量？在ModelArts使用自定义镜像创建训练作业时如何激活conda环境？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
推理前的权重合并转换 - AI开发平台ModelArts

权重文件格式转换任意并行切分策略的Megatron权重格式转化为HuggingFace权重（该场景一般用于将训练好的megatron模型：预训练、lora、sft 重新转回HuggingFace格式），为下一步推理使用准备，无推理任务忽略此章节。一般训练都是多卡分布式训练权重结果文件为多

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
附录：训练常见问题 - AI开发平台ModelArts

附录：训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：容器内执行以下命令，指定NPU内存分配策略的环境变量，开启动态内存分配，即在需要时动态分配内存，可以提高内存利用率，减少OOM错误的发生。 export PYTORCH_NPU_ALLOC_CONF

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

务”的自定义策略，然后将两条策略同时授予用户。创建ModelArts相关OBS的最小化权限的自定义策略。登录IAM控制台，在“权限管理>权限”页面，单击“创建自定义策略”。参数配置说明如下： “策略名称”支持自定义。 “策略配置方式”为“JSON视图”。 “策略内容”请参见M

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
修复Standard专属资源池故障节点 - AI开发平台ModelArts

在想要开启高可用冗余的节点操作列，单击“更多 > 开启高可用冗余”，设置成功后，该节点高可用冗余列标签变为“启用”。如果想批量设置节点开启高可用冗余，可勾选多个节点后，单击列表上方的“开启高可用冗余”按钮实现批量开启。图1 开启高可用冗余能力图2 高可用冗余节点资源池内高可用冗余节点的建议比例：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 609

上一页
1
2
3
4
5
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

标注结果存储在哪里？ - AI开发平台ModelArts

训练作业调测 - AI开发平台ModelArts

推理前的权重合并转换 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练任务的准备工作 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

创建OBS桶用于ModelArts存储数据 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

推理前的权重合并转换 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

创建IAM用户并授权使用ModelArts - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线