搜索_华为云

查询Notebook实例详情 - AI开发平台ModelArts

空间，以实际取值为准。 feature String 实例类别。枚举值： DEFAULT：CodeLab免费规格实例，每个用户最多只能创建一个。 NOTEBOOK：计费规格实例。 billing_items Array of strings 计费资源类型。枚举值： STORAGE：存储资源计费。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
LoRA微调训练 - AI开发平台ModelArts

ndSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 若镜像使用ECS中构建新镜像（二选一）构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
调用MaaS部署的模型服务 - AI开发平台ModelArts

1，temperature > 0。使用beam_search场景下，n取值建议为1<n≤10。如果n=1，会导致推理请求失败。说明： n建议取值不超过10，n值过大会导致性能劣化，显存不足时，推理请求会失败。 use_beam_search 否 False Bool 是否使用beam_search替换采样。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

租户可见域名：指租户可访问的域名，需要格外重视安全性和合规性。租户不可见域名：指华为云服务在内网相互调用使用的域名，外部用户无法访问到对应的权威DNS服务器；或者Internet受限访问域名，只允许华为办公网络黄&绿区华为员工及合作方或外包人员访问的域名。华为云基础域名安全使用，避免直接为租户分配基础域名。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed) 规格与节点数 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

ndSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 若镜像使用ECS中构建新镜像（二选一）构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/llama2/0_pl_pretrain_13b.sh 选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表2进行配置。图2 选择资源池规格新增SFS Turbo挂载配置，并选择用户创建的SFS Turbo文件系统。云上挂载路径：输入镜像容器中的工作路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
创建并管理工作空间 - AI开发平台ModelArts

训练作业CPU规格训练核数默认无限制，支持设置1~10000。核训练作业GPU规格训练卡数默认无限制，支持设置1~1000。卡训练作业RAM规格训练内存大小默认无限制，支持设置1~100000。 GB 智能标注GPU规格使用时长默认无限制，支持设置1~60000。分钟工作空间的配额

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用获取训练作业支持的公共规格接口获取训练作业支持的资源规格。调用获取训练作业支持的AI预置框架接口查看训练作业支持的引擎类型和版本。调用创建算法接口创建一个算法，记录算法id。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

image.save(f"astronaut_rides_horse_{rank}.png") 观察两个实例的显存占用情况，若其中一个实例相比另外一个实例占用更少的显存，且少占用的显存大小等于权重的大小，表明多实例共享权重功能成功开启。若不需要使用共享显存功能时，请通过以下命令关闭共

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询训练作业指定任务的运行指标 - AI开发平台ModelArts

MetricObject 参数参数类型描述 metric String 运行指标，可选值如下： cpuUsage：CPU使用率 memUsage：物理内存使用率 gpuUtil：GPU使用率 gpuMemUsage：显存使用率 npuUtil：NPU使用率 npuMemUsage：NPU显存使用率

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询资源实时利用率 - AI开发平台ModelArts

统计间隔，1s表示1秒，1m表示1分钟，1h为1小时。表7 Value 参数参数类型描述 cpu String cpu量，即计算资源量。 memory String 内存。 tnt004 String GPU卡的数量。表8 ResourceMetricsMetadata 参数参数类型描述 name String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查看在线服务详情 - AI开发平台ModelArts

请勿打印无用的audio日志文件，这会导致系统日志卡死，无法正常显示日志，可能会出现“Failed to load audio”的报错。升级为WebSocket 是否升级为WebSocket服务。您可以进入在线服务的详情页面，通过切换页签查看更多详细信息，详情说明请参见表2。表2 在线服务详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
在推理生产环境中部署推理服务 - AI开发平台ModelArts

若需要部署量化模型，请参考推理模型量化在Notebook中进行权重转换，并将转换后的权重上传至OBS中。权重文件夹不要以"model"命名，若以"model"命名会导致后续创建AI应用报错。推理启动脚本run_vllm.sh制作请参见下文创建推理脚本文件run_vllm.sh的介绍。 SSL证书制作包含cert

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
部署推理服务 - AI开发平台ModelArts

评估推理资源。运行如下命令，返回NPU设备信息可用的卡数。 npu-smi info # 启动推理服务之前检查卡是否被占用、端口是否被占用，是否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

from __future__ import print_function import os import gzip import codecs import argparse from typing import IO, Union import numpy as np import

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 若镜像使用ECS中构建新镜像和Notebook中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/work/llm_train/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
SFT全参微调训练 - AI开发平台ModelArts

dSpeed; sh ./scripts/install.sh; sh ./scripts/obs_pipeline.sh 如果镜像使用ECS中构建新镜像构建的新镜像时，训练作业启动命令中输入： cd /home/ma-user/modelarts/user-job-dir/AscendSpeed;

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

S桶名称）。预下载至本地目录选择“不下载”。 “资源类型”：选择GPU单卡的规格。如果有免费GPU规格，可以选择免费规格进行训练。其他参数保持默认即可。本样例代码为单机单卡场景，选择GPU多卡规格会导致训练失败。单击“提交”，确认训练作业的参数信息，确认无误后单击“确定”。

帮助中心 > AI开发平台ModelArts > 快速入门

总条数： 543

上一页
1
...
15
16
17
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询Notebook实例详情 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.908） - AI开发平台ModelArts

查询训练作业指定任务的运行指标 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线