搜索_华为云

管理员和开发者权限分离 - AI开发平台ModelArts

"ecs:serverKeypairs:list", "ecs:serverKeypairs:get", "ecs:serverKeypairs:delete", "ecs:serverKeypairs:create"

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
制作自定义镜像用于推理 - AI开发平台ModelArts

模型的自定义镜像制作流程在Notebook中通过镜像保存功能制作自定义镜像用于推理在Notebook中通过Dockerfile从0制作自定义镜像用于推理在ECS中通过Dockerfile从0制作自定义镜像用于推理父主题：制作自定义镜像用于ModelArts Standard

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
制作自定义镜像用于创建Notebook - AI开发平台ModelArts

制作自定义镜像用于创建Notebook Notebook的自定义镜像制作方法在ECS上构建自定义镜像并在Notebook中使用在Notebook中通过Dockerfile从0制作自定义镜像在Notebook中通过镜像保存功能制作自定义镜像父主题：制作自定义镜像用于ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
上传镜像 - AI开发平台ModelArts
上传镜像 - AI开发平台ModelArts

客户端上传镜像，是指在安装了容器引擎客户端的机器上使用docker命令将镜像上传到容器镜像服务的镜像仓库。如果容器引擎客户端机器为云上的ECS或CCE节点，根据机器所在区域有两种网络链路可以选择：如果机器与容器镜像仓库在同一区域，则上传镜像走内网链路。如果机器与容器镜像仓库不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
配置IAM权限 - AI开发平台ModelArts

"Action": [ "vpc:*:*", "ecs:*:get*", "ecs:*:list*" ], "Effect": "Allow"

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
推理场景介绍 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档和本文档配套的模型训练文档请

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

基于原始pth模型前向推理。 output = model_inference(input_data) # 保存网络输出节点名称、维度、shape及输出到本地文件。 with open("output_data.txt", "w") as f: f.write("output_node_name

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Standard专属资源池 - AI开发平台ModelArts

Standard专属资源池 ModelArts支持使用ECS创建专属资源池吗？在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？

帮助中心 > AI开发平台ModelArts > 常见问题
上传算法至SFS - AI开发平台ModelArts

gz在OBS上的路径（需将文件设置为公共读）。单机单卡运行脚本： # 在代码主目录下创建一个run.sh，内容如下 #!/bin/bash # 从obs中下载数据到本地SSD盘 DIS_DATA_PATH=/cache SRC_DATA_PATH=${imagenet数据集在obs中分享链接} OBSUT

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
准备镜像环境 - AI开发平台ModelArts

h_npu->diffusers的所有文件，将diffusers整个目录上传到宿主机上。依赖的插件代码包、模型包和数据集存放在宿主机上的本地目录结构如下，供参考。 [root@devserver docker_build]# ll total 192 -rw------- 1

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

ma_container_notebook_cache_dir_size_bytes GPU和NPU类型的Notebook会在“/cache”目录上挂载一块高速本地磁盘，该指标描述该目录的总大小。字节（Bytes） ≥0 NA NA NA Notebook cache目录利用率 ma_contain

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
配置Lite Cluster存储 - AI开发平台ModelArts

适用于训练数据集的存储。对象存储。常用OBS SDK进行样本数据下载。存储量大，但是离节点比较远，直接训练速度会比较慢，通常会先将数据拉取到本地cache，然后再进行训练任务。静态挂载动态挂载 SFS Turbo 适用于海量小文件业务场景。提供posix协议的文件系统；需要和资源池在同一个VPC下或VPC互通；

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
离线训练安装包准备说明 - AI开发平台ModelArts

|——... 步骤二：资源安装将资源上传至机器中，确保容器能够访问，并进入已创建的容器。 Python依赖包本地安装：进入pip文件所在的路径，并运行安装命令。如下列所示。 pip install numpy pip install transfor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
查询数据处理任务版本的结果展示 - AI开发平台ModelArts

样本ID，通过OBS路径的md5生成。 signed_new_source String 签名后的处理后样本地址。 signed_origin_source String 签名后的原样本地址。 version_id String 数据处理任务的版本ID。请求示例查询数据处理任务版本的结果展示

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
离线训练安装包准备说明 - AI开发平台ModelArts

|——... 步骤二：资源安装将资源上传至机器中，确保容器能够访问，并进入已创建的容器。 Python依赖包本地安装：进入pip文件所在的路径，并运行安装命令。如下列所示。 pip install numpy pip install transfor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考
SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

gc-poc-sdxl-lora-train.tar.gz代码包。解压后上传到宿主机上。依赖的插件代码包、模型包和数据集存放在宿主机上的本地目录结构如下，供参考。 [root@devserver-ei-cto-office-ae06cae7-tmp1216 docker_build]#

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
SFT全参微调训练 - AI开发平台ModelArts

分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
LoRA微调训练 - AI开发平台ModelArts

分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。 “输入”和“输出”中的获取方式全部选择为：环境变量。 “输出”中的预下载至本地目标选择：下载，此时输出路径中的数据则会下载至OBS中。 Step3 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

171ba0b3"。该问题会导致代码安装失败，会在后续版本修复。代码上传至OBS 将AscendSpeed代码包AscendCloud-3rdLLM-905-xxx.zip在本地解压缩后，将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代码文件都上传至OBS后，OBS桶的目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
执行训练任务（推荐） - AI开发平台ModelArts

非必填。表示训练step迭代次数，有默认值 seed 1234 随机种子数。每次数据采样时，保持一致。 save-interval 1000 用于模型中间版本地保存。当参数值>=TRAIN_ITERS时，生成模型仅保存经过TRAIN_ITERS次训练后的最后一个版本。当参数值<TRAIN_IT

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务

总条数： 750

上一页
1
...
32
33
34
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理员和开发者权限分离 - AI开发平台ModelArts

制作自定义镜像用于推理 - AI开发平台ModelArts

制作自定义镜像用于创建Notebook - AI开发平台ModelArts

上传镜像 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

配置Lite Cluster存储 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

查询数据处理任务版本的结果展示 - AI开发平台ModelArts

离线训练安装包准备说明 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线