搜索_华为云

资源池 - AI开发平台ModelArts
资源池 - AI开发平台ModelArts

资源池创建资源池失败 Standard资源池节点故障定位专属资源池关联SFS Turbo显示异常

 帮助中心 > AI开发平台ModelArts > 故障排除
性能可视化工具与性能分析工具 - AI开发平台ModelArts

对于集群训练场景，昇腾提供了集群分析工具cluster_analysis，当前主要对基于通信域的迭代内耗时分析、通信时间分析以及通信矩阵分析为主，从而定位慢卡、慢节点以及慢链路问题。父主题： PyTorch迁移性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
步骤总览 - AI开发平台ModelArts
步骤总览 - AI开发平台ModelArts

创建网络购买ModelArts专属资源池购买弹性云服务器ECS 基本配置：权限配置专属资源池VPC打通 ECS服务器挂载SFS Turbo存储（可选）工作空间配置训练：上传数据和算法至SFS（首次使用时需要）使用Notebook进行代码调试创建训练任务多机多卡

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
SFT全参微调训练任务 - AI开发平台ModelArts

仅需要修改预训练中的多机训练执行命令即可 - name: main args: - cd /mnt/sfs_turbo/llm_train/AscendSpeed; sh scripts/llama2/0_pl_sft_70b.sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
创建和保存Pascal VOC文件 - AI开发平台ModelArts

"@modelarts:shape": "bndbox", "@modelarts:feature": [[347, 186], [382, 249]]}, {"@modelarts:color":

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"conversation_id": 1, "meta_instruction": "", "num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
LoRA微调训练 - AI开发平台ModelArts

仅需要修改预训练中的多机训练执行命令即可 - name: main args: - cd /mnt/sfs_turbo/llm_train/AscendSpeed; sh scripts/llama2/0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"conversation_id": 1, "meta_instruction": "", "num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
托管模型到AI Gallery - AI开发平台ModelArts

要满足自定义模型规范，否则该模型无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。当托管的是自定义镜像时，上传的模型文件要满足自定义镜像规范，否则该镜像无法正常使用AI Gallery工具链服务（微调大师和在线推理服务）。当文件状态变成“上传成功”表示数据文件成功上传至AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
通过patch操作对服务进行更新 - AI开发平台ModelArts

替换的目标值。响应参数状态码： 200 表5 响应Header参数参数参数类型描述 X-Request-Id String 请求链路编号，可用于日志追踪表6 响应Body参数参数参数类型描述 update_time String 本次更新时间，仅触发服务配置升级

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
典型场景配置实践 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限管理员和开发者权限分离使用Cloud Shell登录训练容器限制用户使用公共资源池给子账号配置文件夹级的SFS Turbo访问权限父主题： Standard权限管理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理
测试用户权限 - AI开发平台ModelArts

注册镜像。验证SFS权限。在左上角的服务列表中，选择SFS服务，进入SFS管理控制台。在SFS管理控制台，在SFS Turo中单击右上角的“创建文件系统”，如果能正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备训练模型适用的容器镜像。准备Notebook 本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
Lite Cluster资源开通 - AI开发平台ModelArts

可用区是在同一区域下，电力、网络隔离的物理区域。可用区之间内网互通，不同可用区之间物理隔离。随机分配：系统自动分配可用区。指定AZ：指定资源池节点在哪个可用区域。考虑系统容灾时，推荐指定节点在同一个可用区。可设置可用区的节点数。节点数量选择专属资源池的节点数，选择的节点数越多，计算性能越强。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
预训练任务 - AI开发平台ModelArts

command: ["/bin/sh", "-c"] args: - cd /mnt/sfs_turbo/llm_train/AscendSpeed; sh scripts/llama2/0_pl_pretrain_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

如果图片不是（1，336，336）shape，将会被resize。 --image-feature-size：图片输入解析维度大小；llava-v1.6图片输入维度与image-feature-size关系映射表见git；计算原理如下：最小处理单元为14*14 【llava1.5】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

x版本，推荐使用3.7.x版本。如果本地安装SDK时，出现如下图中的报错，需要先安装3.1.1版本的futures依赖包，然后再重新安装SDK。 pip install futures==3.1.1 图1 安装ModelArts SDK报错信息当pip版本>=24.1版本时，会对

 帮助中心 > AI开发平台ModelArts > SDK参考
查询所有Notebook实例列表 - AI开发平台ModelArts

project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 feature 否 String 实例类别，默认为NOTEBOOK。枚举值如下： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 595

上一页
1
...
7
8
9
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

资源池 - AI开发平台ModelArts

性能可视化工具与性能分析工具 - AI开发平台ModelArts

步骤总览 - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

创建和保存Pascal VOC文件 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

托管模型到AI Gallery - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

典型场景配置实践 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线