搜索_华为云

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

创建IAM用户并授权使用MaaS 配置ModelArts委托授权章节中介绍的一键式自动授权方式创建的委托的权限比较大，基本覆盖了依赖服务的全部权限。如果华为云账号已经能满足您的要求，则不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用MaaS服务的功能。 ModelArt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。图4 创建SFS Turbo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。需要由IAM用户设置SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
推理精度测试 - AI开发平台ModelArts

的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_eval等生成式回答（生成式回答是对整体进行评测，少一个字符就可能会导致判断错误）时，max_out_len设置建议

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
配置Lite Server存储 - AI开发平台ModelArts

配置Lite Server存储 Server服务器支持SFS、OBS、EVS三种云存储服务，提供了多种场景下的存储解决方案，主要区别如下表所示。若需要对本地盘进行配置，请参考物理机环境配置。表1 表1 SFS、OBS、EVS服务对比对比维度弹性文件服务SFS 对象存储服务OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
查询训练作业详情 - AI开发平台ModelArts

pod_reschedule: Pod级重调度 job_reschedule: Job级重调度 job_reschedule_with_taint: 隔离式Job重调度 end_recover_before_downgrade String 本次运行结束后在故障容忍策略降级前所采取的容忍策略，取值范围同end_recover。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
标注图像分类数据 - AI开发平台ModelArts

标注图像分类数据由于模型训练过程需要大量有标签的图片数据，因此在模型训练之前需对没有标签的图片添加标签。通过ModelArts您可对图片进行一键式批量添加标签，快速完成对图片的标注操作，也可以对已标注图片修改或删除标签进行重新标注。请确保数据集中已标注的图片不低于100张，否则会导致

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
终止训练作业 - AI开发平台ModelArts

pod_reschedule: Pod级重调度 job_reschedule: Job级重调度 job_reschedule_with_taint: 隔离式Job重调度 end_recover_before_downgrade String 本次运行结束后在故障容忍策略降级前所采取的容忍策略，取值范围同end_recover。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
模型训练使用流程 - AI开发平台ModelArts

见以PyTorch框架创建训练作业。训练作业进阶功能 ModelArts Standard还支持以下训练进阶功能，例如：增量训练分布式训练训练加速训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
推理精度测试 - AI开发平台ModelArts

的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_eval等生成式回答（生成式回答是对整体进行评测，少一个字符就可能会导致判断错误）时，max_out_len设置建议

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

持多卡训练），对应值可选择multiple（支持）、singular（不支持）； host_distributed_mode（是否支持分布式训练），对应值可选择multiple（支持）、singular（不支持）。 values 否 Array of strings 资源约束键对应值。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

型文件、训练数据等，再将OBS中的数据文件导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格。适配的CANN版本是cann_8.0.rc3，驱动版本是23

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908）
终止训练作业 - AI开发平台ModelArts

表36 flavor_info 参数参数类型描述 max_num Integer 可以选择的最大节点数量（max_num，为1代表不支持分布式）。 cpu cpu object cpu规格信息。 gpu gpu object gpu规格信息。 npu npu object Ascend规格信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

如需开启以下高阶配置，请在•创建推理脚本文件run_vllm.sh章节创建的推理脚本run_vllm.sh中增加需要开启的高阶配置。词表切分在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。需要由IAM用户设置SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo存储联动，可以将最新的训练数据导入到SFS Turbo，然后在训练作业中挂载SFS Turbo到容器对应ckpt目录，实现分布式读取训练数据文件。创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。需要由IAM用户设置SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

示专属资源池规格。 Compute Nodes 计算资源节点个数。数量设置为1时，表示单机运行；数量设置大于1时，表示后台的计算模式为分布式。 Available/Total Nodes 当“Specifications”选择专属资源池规格时，显示专属资源池的可用实例数和总实例数，用户选择“Compute

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。 xxx 计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。 1 更多选项永久保存日志选择是否打开“永久保存日志”开关。关闭事件通知选择是否打开“事件通知”开关。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
权限管理 - AI开发平台ModelArts
权限管理 - AI开发平台ModelArts

严格授权模式是指在IAM中创建的子用户必须由账号管理员显式在IAM中授权，才能访问ModelArts服务，管理员用户可以通过授权策略为普通用户精确添加所需使用的ModelArts功能的权限。相对的，在非严格授权模式下，子用户不需要显式授权就可以使用ModelArts，管理员需要在IA

帮助中心 > AI开发平台ModelArts > 产品介绍

总条数： 205

上一页
1
...
5
6
7
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

标注图像分类数据 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

权限管理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线