搜索_华为云

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

API网关也仅校验AppCode，不校验请求签名，从而实现快速响应。您可以在服务详情页的“调用指南”页签（如图5）获取API接口公网地址（对应下文示例中的在线服务的调用地址url）和AppKey/AppSecret（对应下文示例中的app_key、app_secret）和App

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
执行训练任务（推荐） - AI开发平台ModelArts

新的训练方式将统一管理训练日志、训练结果和训练配置，使用yaml配置文件方便用户根据自己实际需求进行修改。推荐用户使用该方式进行训练。步骤一上传训练权重文件和数据集如果在准备代码和数据阶段已经上传权重文件和数据集到容器中，可以忽略此步骤。如果未上传训练权重文件和数据集到容器中，具体参考上传代码和权重文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
创建Notebook实例 - AI开发平台ModelArts

SSH：可以通过SSH协议远程连接Notebook。 key_pair_names 否 Array of strings SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。表4 VolumeReq 参数是否必选参数类型描述 capacity 否 Integer 存储

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

/url 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。 task_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

ODE_RANK”，使得ranktable路由规划生效。训练启动脚本（xxxx_train.sh）示例如下。其中“MASTER_ADDR”和“NODE_RANK”必须保持该赋值。 #!/bin/bash # MASTER_ADDR MASTER_ADDR="${MA_VJ_NA

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。表1 环境要求名称版本 CANN cann_8.0.rc3 驱动 24.1.rc1 PyTorch 2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查看诊断报告 - AI开发平台ModelArts

rank，用于分析计算和任务下发的快慢卡)和集群带宽统计数值(slow link，用于分析集群中的网络通信慢链路)。点开slow rank模块，html中会基于表格展示每张卡不同step的计算耗时、通信耗时和空闲耗时。基于该表格，通常关注计算耗时(compute)和空闲耗时(free

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

learning时，均需要替换为此处实际创建的组织名称。单击右上角“登录指令”，获取登录访问指令。以root用户登录ECS环境，输入登录指令。图1 在ECS中执行登录指令登录SWR后，使用docker tag命令给上传镜像打标签。下面命令中的组织名称deep-learning，请替换为a

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
执行训练任务【新】 - AI开发平台ModelArts

断点续训：训练过程中保存的某个权重，可参考断点续训和故障快恢说明 train_auto_resume false 【可选】是否开启【故障快恢】功能，【true、false】默认false不开启，当训练中断时重启任务会从最新生成权重文件处继续训练。可参考断点续训和故障快恢说明 stage pt 表示训练类型。可选择值：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
非分离部署推理服务 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
准备镜像环境 - AI开发平台ModelArts

准备镜像环境准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

0.1:8080/goodbye 图3 访问在线服务 limit/request配置cpu和内存大小，已知单节点Snt9B机器为：8张Snt9B卡+192u1536g，请合理规划，避免cpu和内存限制过小引起任务无法正常运行。父主题： Lite Cluster资源使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
ModelArts最佳实践案例列表 - AI开发平台ModelArts

由于ModelArts产品的持续更新和迭代，第三方案例中的界面和步骤可能因时效性而与最新产品有所差异，仅供学习和参考。表6 第三方案例列表分类文章名称作者 Standard自动学习 2步打通ModelArts和Astro实现AI应用落地胡琦 Standard开发环境想不想让一张静态的照片动起来

 帮助中心 > AI开发平台ModelArts > 最佳实践
查询服务详情 - AI开发平台ModelArts

running：运行中，服务正常运行。 deploying：部署中，服务正在部署，包含打镜像和调度资源部署。 concerning：告警，后端实例部分存在异常。 failed：失败，服务部署失败，失败原因可以看事件和日志标签页。 stopped：停止。 finished：只有批量服务会有这个状态，表示运行完成。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
使用MaaS压缩模型 - AI开发平台ModelArts

Studio左侧导航栏中，选择“模型压缩”进入作业列表。单击作业名称，进入压缩作业详情页面，可以查看作业详情和日志。 “详情”：可以查看作业的基本信息，包括作业、模型、资源等设置信息。 “日志”：可以搜索、查看和下载作业日志。删除压缩作业删除操作无法恢复，请谨慎操作。登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
推理精度测试 - AI开发平台ModelArts

/...目录下，查找到summmary目录，有txt和csv两种保存格式。总体打分结果参考txt和csv文件的最后一行，举例如下： npu： mmlu：46.6 gpu： mmlu：47 NPU打分结果（mmlu取值46.6）和GPU打分结果（mmlu取值47）进行对比，误差在1以内（计算公式：(47-46

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
自定义脚本代码示例 - AI开发平台ModelArts

理代码和配置文件也需遵循ModelArts的要求。本章节提供针对常用AI引擎的自定义脚本代码示例（包含推理代码示例）。模型推理代码编写的通用方法及说明请见模型推理代码编写说明。 Tensorflow TensorFlow存在两种接口类型，keras接口和tf接口，其训练和保存模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
准备推理环境 - AI开发平台ModelArts

"software|firmware" #查看驱动和固件版本如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
推理场景介绍 - AI开发平台ModelArts

软件配套版本本方案支持的软件配套版本和依赖包获取地址如表2所示。表2 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
Notebook中构建新镜像 - AI开发平台ModelArts

Notebook中构建新镜像 ModelArts中注册镜像通过ECS获取和上传基础镜像将基础镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。镜像注册的操作步骤如下：登录ModelArts管理控制台，在左侧导航栏单击“镜像管理”。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像

总条数： 680

上一页
1
...
20
21
22
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

查询训练作业指定任务的日志（OBS链接） - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

使用预置镜像制作自定义镜像用于训练模型 - AI开发平台ModelArts

执行训练任务【新】 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

准备推理环境 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线