搜索_华为云

测试用户权限 - AI开发平台ModelArts

正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。在ECS管理控制台，单击右上角的“购买弹性云服务器”，如果能正常打开页面，表示当前用户具备ECS的操作权限。验证VPC权限。在左上角的服务列表中，选择VPC服务，进入VPC管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” - AI开发平台ModelArts

者方法第三方pip源中的python包版本更新，导致在训练作业中安装的python包的版本可能也会发生变化。如训练作业之前无此问题，后面一直有此问题，则考虑是此原因。处理方法通过Notebook调试。安装时指定版本。如：pip install xxx==1.x.x 第三方

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Lite Server高危操作一览表 - AI开发平台ModelArts

本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS ID已经不一致，因此EVS系统盘将不支持扩容，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

如果要使用自动重启功能，资源规格必须选择八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图3 选择资源池规格作业日志选择OBS中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

如果要使用自动重启功能，资源规格必须选择八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。 Step5 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图4 选择资源池规格作业日志选择OBS中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
迁移环境准备 - AI开发平台ModelArts

缺点：资源申请周期长，购买成本高，管理视角下资源使用效率较低。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于方式二的环境进行操作，请参考方式二中的环境开通和配置指导完成裸机和容器开发初始化配置。注意业务基础镜像选择Ascend+PyTorch镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
版本说明和要求 - AI开发平台ModelArts

版本说明和要求资源规格要求本文档中的模型运行环境是ModelArts Lite的弹性节点Server。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。请参考Lite Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
训练迁移快速入门案例 - AI开发平台ModelArts

包，具有root权限，结合配置指导、初始化工具及容器镜像可以快速搭建昇腾开发环境。开通裸金属服务器资源请参见DevServer资源开通，在裸金属服务器上搭建迁移环境请参见裸金属服务器环境配置指导，使用ModelArts提供的基础容器镜像请参见容器环境搭建。训练代码迁移前提条件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
非分离部署推理服务 - AI开发平台ModelArts

PYTORCH_NPU_ALLOC_CONF=expandable_segments:False；llava多卡启动时需要关闭虚拟内存扩展；开启时可能提升模型性能。允许分配器最初创建一个段，然后在以后需要更多内存时扩展它的大小。 --image-input-type：图像输入模式，pixel_values and

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

创建完Notebook后，单击操作列的“打开”，报错如下：解决方案：复制页面的域名，添加到windows代理“请勿对以下列条目开头的地址使用代理服务器”中，然后保存就可以正常打开。父主题：实例故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 实例故障
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

ModelArts SDK支持在本地安装配置使用。使用时，需进行Session鉴权。本地安装SDK。如果本地未安装SDK，可参考（可选）本地服务器安装ModelArts SDK安装；如果本地已安装，则无需再次安装。进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。

帮助中心 > AI开发平台ModelArts > SDK参考
场景介绍及环境准备 - AI开发平台ModelArts

DevServer 该环境为裸机开发环境，主要面向深度定制化开发场景。环境开通指导请参考DevServer资源开通；环境配置指导请参考Snt9B裸金属服务器环境配置指南。本文基于ModelArts Lite DevServer进行操作，请参考上表说明在贵阳一环境开通和配置指导完成裸机和容器开发初始化配置。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

${image_name} 为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。通过容器名称进入容器中。启动容器时默认用户为ma-user用户。 docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
查询专属资源池列表 - AI开发平台ModelArts

description String 集群备注。 project String 集群归属项目。 allocatable_memory Integer 可使用的内存数。 cluster_id String 集群ID。 nodes ClusterNode object 集群节点配置。 allocatable_cpu_cores

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 指定每个设备的训练批次大小。 gradient_accumulation_steps 8 必须修改，指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可参考表1 output_dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

available for the selected specification.）图1 资源不足，服务调度失败原因分析实例配置的规格过大，CPU或者内存剩余资源不足；（"insufficient CPU" / "insufficient memory"）模型需要的磁盘空间大，磁盘空间不足；（"x

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

DeepSpeed的核心思想是在单个GPU上实现大规模模型并行训练，从而提高训练速度。DeepSpeed提供了一系列的优化技术，如ZeRO内存优化、分布式训练等，可以帮助用户更好地利用多个GPU进行训练 Accelerate是一种深度学习加速框架，主要针对分布式训练场景。Acce

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
Lite Server部署推理服务 - AI开发平台ModelArts

k_table_file.json文件中配置的container_ip保持一致。 expandable_segments-使能内存池扩展段功能，即虚拟内存特性。 ${RANKTABLEFILE}：rank_table_file.json文件挂载到容器中的地址${container

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

境运行，device_target="Ascend"表示在Ascend环境运行。本地代码开发调测。一般本地CPU算力较低并且内存较小，可能出现内存溢出的报错，因此可以把“models/official/cv/resnet/config/resnet50_imagenet2012_config

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
查询AI应用列表 - AI开发平台ModelArts

ModelSpecification object 模型部署最小部署规格。表6 ModelSpecification 参数参数类型描述 min_cpu String 最小CPU规格。 min_gpu String 最小GPU规格。 min_memory String 最小内存。 min_ascend String

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理

总条数： 747

上一页
1
...
16
17
18
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

测试用户权限 - AI开发平台ModelArts

训练作业日志中提示 “AttributeError: module '' has no attribute ''” - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

版本说明和要求 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？ - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

查询专属资源池列表 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

Lite Server部署推理服务 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线